记得刚刚用非系统自带的输入法的时候,就是用搜狗和紫光两家。但是后来因为各种原因,把紫光卸载了没有用了,用搜狗、qq、加加三家。
刚刚出来的新版紫光试用以后感觉很不错,智能性有了提高,速度也很快。加上解决了单字辅助码的挂接,我已经正式用回了紫光,现在基本上可以说把qq要淘汰一段时间了。用了几天以后,根据自己的感受给开发组提几个建议。
一、智能化水平还有上升的空间
用了最新版紫光的感觉就是智能化水平有所提高,赞歌我就不多唱了。就说说紫光还有那些提升的空间。
看了四哥的测试很强大,但是我感觉测试的重点在于正规语言和书面语言。这些语言的正确率当然重要,但是就普通用户而言,口语的成功率才是关键。开发组以后的重点应该在这个方面。我喜欢用举例来说明问题(当然几个句子不能证明什么,但是我要说明问题必须要举例子)我说的都是常用的口语。
如:我没有你那么贪心-----紫光的结果是:我没有你那么谈心。加了25兆语料库以后正确了。这个句子应该很常用的,而且还是比较规范的。
如:你说的不清不楚(的---这个字可以加,也可以不加)----紫光的结果是:你说的不清不出。加了25兆语料库无效,加了50兆语料库,还是无效。这句也是很常用和规范的口语吧。
上面两个句子搜狗、加加、qq都是正确的。当然几个句子不能说明全部问题,比如搜狗也会有“打字通缉”这样让人啼笑皆非的组词。我的总体感觉这次紫光新版的智能性已经超过了qq1.3版和加加5.0版。但是在口语上(因为我不可能去测试书面语言)感觉还是搜狗强一些,可能是我的打字习惯是短语、短句、词组多,而长句很少吧。
来紫光论坛知道四哥是专注紫光的智能改善,个人觉得紫光在口语智能的提高上面还有上升空间,希望继续努力。
嗯,对了还有就是搜狗在短语上的优势也可以学习,短语和短句的区别应该就是把长句断开打。搜狗断句后的准确率值得称道。
我曾经在qq拼音内部群举例子说明qq在断句后准确率的差距。
如:现在还是以同情为主-----搜狗和qq都正确。如果断开打:现在还是///以同情为主。qq的后半句就成了:一同情为主。
我也拿紫光举个例子:你貌似没说话-----搜狗和紫光的智能组词都正确。但是有的词组派可能不习惯打那么长,当然也不想打单字。断开打:你貌似///没说话。
搜狗出来的是“你貌似”可以直接上屏,加加出来的是“你冒死”不是我要的,但正确。紫光出来的是“你茅斯”(加25兆语料库无效,加50兆语料库就是“你貌似”了)……这个恐怕说不过去吧。
二、关于用户词库参与智能组词的问题。
个人觉得如果一个输入法的智能核能够处理好词性、介宾关系、词频。那么我双手赞成用户词库参与智能组词。但是现在所谓的用户词库参与组词只是依赖词频吧。就是以算法高明而著称的谷歌,也不能处理好介宾关系。
所以就我接触的加加和狂拼用户来说都有说用了一段时间觉得智能下降的,当然狂拼正式版说增加一个“记忆优化”(这个词紫光也组错了,用25兆语料库)功能解决这个问题,不知道效果如何。
某人喜欢自造“刘华德”“周驰星”来智能组句,以此来证明这个输入法的智能水平,我看紫光开发组千万别上他的当,坚持自己的想法。当这类人用自造了“姜琳”来组句“我想把这个东西快递给姜琳”来嘲笑紫光和搜狗组成“我想把这个东西快递给降临”的时候,就会同时面对“好运怎么样才能姜琳”这样的可笑句子。
本来字词派嘲笑智能的最大缺点是什么?确定性差,现在这种依赖词频的用户词库参与组词就是增加智能的不确定性,难道可取吗?如果这样能行的话,qq早就做了,因为内部群里面总有人提出来,qq的官方的回答总是正在考虑,不过要慎重。
就目前而言,紫光倒是可以学学qq的半开放,就是在无重码的情况下,让用户词库参与组词,有重码的情况下让位系统词库。
三、辅助码的问题
紫光没有辅助码一直是被人诟病的问题,紫光开发组几个月前就说要有,结果这次的新版本还是没有。
紫光的用户不同于加加的用户,基本上都是普通用户,可能对辅助码要求不是很高。
除了学习搜狗、加加的tap键间接部首和笔画辅助码可以借鉴外,还可以借鉴加加的“67890”五笔画笔画直接辅助码,本来加加也是借鉴了智能abc的八笔形辅助码,大家都是借鉴。我想这种辅助码对于普通用户来说易学易用,很不错。
另外就是紫光有声调辅助,但是使用起来非常麻烦。对于双拼用户来说可不可以学习新华拼音的声调直接辅助码呢?开发组的人可以下载新华拼音试试就知道了。
以上观点仅供参考,呵呵
[ 本帖最后由 岳家军 于 2008-7-27 19:54 编辑 ] |