1.智能组词和大词库是两码事.
智能组词,或者说是智能整句算法的优劣,跟词库没多少关系的.在对比测试的时候,一定要剥离大词库的干扰,否则你只是测得了模糊的识别率对比数据,但是你不可能得知高下的原因.
2.词输入法对于智能组词并不需要有多高的期待,智能组词功能的好坏对于输入法效率的影响微乎其微,当然前提是用法正确.非要拿词输入法打句子的人不在少数,但是他们慢并不代表输入法不行.
3.不要去期待机器具备人的思维.机器对于语言的处理算法,跟人脑的算法完全不同.机器存在一个分辨准确率,某些算法的准确率要高一些,某些算法准确率不佳.输入法蒙对了,只有两种可能,要么是智能性好,要么是你的运气好.
要不然,我只打zinen
用模糊音做例子么...我猜你是在想,模糊音启用之后,识别率会降低一半?事实上并非如此.智能算法不会只考虑单独一个音节,从整体分析的话,人脑能够从大量模糊化的音节当中识别出正确的句子,机器也一样可以.识别率只是降低一点点而已,就好像我模糊音全开打词组,首选上屏也只降低很少一点点(这个我是试过的).
为什么说智能组词功能对于词输入法不重要?
目前我的拼音加加用户词库规模是2.6万,用它去除跟系统词库做的交集,剩下的就是我的自造词.有多少呢...我还没算呢,呵呵...再平均到每一天会是几个?
输入法用的是拼音加加,不过自造词的方法每个输入法都差不多的.
当然也有另一个原因,目前智能组词算法能让我满意的,根本就不存在,包括拼音加加.
的确很想为拼音加加的智能组词能力的提高做一些事情...看样子该行动了,呵呵.
智能组词能力的提高,小问题嘛,
寂寞的湖...一个超大词库而已,有必要测试了才放出来?真是想不通啊,难道说,紫光对超大词库支持还是有什么问题么,呵呵... |