|
|
个人观点:
1、优化过的、精准的基础库,大小方面同意5楼古陶瓦的说法。
虽然我也算是个字词派,但还是觉得习惯于2-3字输入的人,还是应该逐渐过渡到4-6字的短语、短句打法,太长了一旦智能组句出错,修改起来比较麻烦,太短了就无法发挥语言模型的智能性。关于这一点,举个例子来说,词库当中可能“事后”的词频高于“时候”,输入速度快了就容易把后者错输为前者,而且一旦上屏,后台的词频调整可能永远无法将“时候”前置。而如果输入“deshihou”,无论词频谁高,语言模型会自动合成“的时候”,避免出错。当然,这只是个例子,我个人使用的是“d=的”的固顶字设置,智能ABC时代留下的老习惯了
2、如果基础库为了速度选择得比较小,应该再加一个名人词库。如果因为职业的关系经常输入各种不同的姓名(如教师),可以加一个人名词库。一般人交际圈内的姓名可以交给用户词库慢慢积累
3、居住地的地名词库或者综合词库
4、自己专业、职业的词库。这方面紫光尚不够完善,可以从搜狗那边提取
剩下的,还是交给用户词库吧。建议用户词库到达一定规模以后(如1000词)做一次整理并单独导出,创建为uwl词库加载,然后重新积累用户词库。否则用户词库规模太大整理起来就麻烦了。
不过楼主指的应该就是基础库的选择吧?个人倾向于古陶瓦的。够大够规范~~ |
|