华宇拼音输入法论坛

标题: 紫光什么时候能够自造词参与组句? [打印本页]

作者: cqcq    时间: 2008-3-27 19:18
标题: 紫光什么时候能够自造词参与组句?
刚用了6234版。整体还不错。紫光的整句输入准确率,在印刷体统计中是蛮高的,不过在用户体验上,因为自造词不参与组句,感觉很不方便。解决方法无非两点:
1.加入自造词组句功能。
2.如果确实做不到第一点,可以采用谷歌光标移字修改方式,快速回退光标就可以半句半句上屏了。
现在用紫光,比较苦恼的一点就是自造词不参与组句,很多句子显示出来就很奇怪,又没有光标回退修改功能,只能按退格键重打一遍。这样输入的时候就必须先想清楚,感觉可能不能组句的地方先上屏,再接下去打。
相对而言,加入光标回退修改功能似乎更重要,因为即使没有自造词,由于算法的原因紫光还是会经常在智能组句中出错。谷歌同样也没有自造词组句,但通过光标回退,依然给人很流畅的输入体验,很简单的,修改方便人们就会倾向于一次性输入很多文字,不能修改,则自然变成一个词两个词的输入,为提高准确率而牺牲流畅感。

目前提供自造词组句功能的有两家:qq和加加,qq的新版在固顶字词上有设计错误,一些错词组句无法修正,加加本身架构有误,不能使用。提供光标回退修改功能的只有谷歌,是这个功能很难吗还是有专利?紫光目前仅仅有半句候选,但这是不够的。

觉得输入流畅感不仅仅是扩充语料库的事情,上述两点的作用应该更大。在核心架构没有问题的前提下,也许轻轻一改,就改天换地了。。。。。。。。
不知道紫光的新版会不会在这方面考虑一下,谢了。

[ 本帖最后由 cqcq 于 2008-3-27 19:23 编辑 ]
作者: ZXD4G    时间: 2008-3-27 20:16
标题: 培养整句输入习惯必读
紫光华宇拼音输入法也不是完全不支持回退修改,控制键是CTRL+BACKSPACE,这时:原本是拼音的写作窗口的内容已经是汉字串,通过左右箭头、HOME、END等键去按照汉字定位。

例如:键入【haiyougenghaodezhengjushurujiucuofangshi】之后,写作窗口中是拼音串,各个音节之间自动插入了音节切分符(单引号),候选窗口中出现的是【还有更好的证据输入纠错方式】,其中【证据】一词错误,按CTRL+BACKSPACE,则写作窗口显示【还有更好的证据输入纠错方式】,光标定位在【式】之前,候选窗口显示shi拼音下的单字,用左右箭头移动光标到【证据】处,候选窗口显示的是【整句输入纠错方案】和一些候选词,接着用数字键选择正确的词、字,或者空格上屏即可,这个例子不需要用数字键去选择,当光标移动到【证据】处,候选窗口中显示的是按照后面的拼音串【zhengjushurujiucuofangshi】重新组句的结果,已经是正确的了。

缺陷:本来是纠正整句输入的结果,但纠正后的结果会以自造词的方式记录下来,重复这么长的句子,应该说机会不多,存储这个词毫无必要,以后的改进就是要准确区分究竟是否保存;谷歌也存在这样的缺陷,两种状态区分得不准确……

关于自造词参与智能组词,这个功能有一定的难度,具体在于:自造词和其它字、词之间的关联程度未知,只能设置一些微调权重的值来干预,这些值需要大量试验,包括瞎试,远远不如来自统计的数值那么准确,往往是顾此失彼,所以,需要大量的试验,才能定出一个经验数值。这个是目前的想法,有没有更好的办法,也需要研究和学习。

[ 本帖最后由 ZXD4G 于 2008-3-27 20:20 编辑 ]
作者: kingdick    时间: 2008-3-27 21:41
1.长句嘛,既然提供了这样的输入方式,记录也就是不可避免了——对于聊天来说,短句的重复性还是比较高的;


2.自造词参与智能组词嘛,的确有这个必要,实现起来有难度,也可以理解。关键是:各个输入法如何收集用户多种多样的分词、输入习惯???
作者: ljdqe    时间: 2008-3-27 22:27
真是高手过招啊,
作者: cqcq    时间: 2008-3-30 15:28
哈,原来紫光有回退修改,我倒是没发现。。。。看来紫光也应该做一个功能介绍的教程比较好。不过紫光的方式和谷歌的比起来还是不太方便,能不能直接回退或者只按一个功能键?

至于记录,应该不是问题,其实每个人的打字环境一般都是不断重复的,即使每句话都记录,我估计用户词库应该到30万就基本稳定了。比如我原来用qq,qq是每句话都记录的,用了很久,也就积累到10万左右。那么,对用户词库做一些稳定性处理和数量权重限制,应该问题不大。

自造词是否参与组词,在搜狗论坛上也讨论过几次,我觉得两害相权取其轻,还是应该有自造词参与组词的。
1.用户的实际打字过程中,用于组句的自造词应该大部分是名词,并且多数是2字3字词。简单的只用2字3字自造词参与组句,并且一律定义为名词,估计也就解决大部分问题了。
2.使用感觉中,觉得自造词和智能组词的重叠性不是很大,把自造词设置为最高词频似乎应该是可以的。
3.假如觉得简单算法不完善,那么,直接把自造词列为半句候选其实也是不错的解决办法。比如:我造一个词“逆弯弧”,然后直接打句子出来是:你用你万户的办法试试看。我需要按数字键选择“你用”,然后“逆弯弧”才出现在候选中。假如能把“你用逆弯弧”这半句也列入候选,那么按两下就解决了。
自造词组句,一般不是出现在主语就是出现在宾语,很少出现在补语中的。对目前的紫光来说,出现在主语没问题,候选里有,出现在宾语就比较难搞,但用半句候选应该能解决大部分宾语自造词的问题。

对自造词做半句候选,应该是一种简单又巧妙的处理方式,如果再结合光标回退修改,应该是会很流畅的感觉吧。
作者: cqcq    时间: 2008-3-30 16:05
闲着无事,多唠叨几句~
一个输入法怎么成为主流输入法?主流输入法必然是菜鸟输入法,菜鸟喜欢什么?
1.流畅感:流畅感是由首选准确率和修改方便性两方面组成的。
2.皮肤:得皮肤者得天下。皮肤是输入体验中非常重要的一环。
3.用户词库转移:只有能方便转移用户词库,才能让用户下决心改换门庭。
4.专业词库的提供。
5.强大的功能性,比如英文智能输入,拼音纠错,计算器,字典等等。
6.稳定性和适应性。

我觉得,输入发不一定是大公司做广告才能开发,其实输入法本身做好了,应该能养活自己。
假设在保证速度,稳定性的前提下,把输入法做成一个插件平台,可以自由插入各种实用插件,那么插件本身就可以卖钱。比如很好玩的动画皮肤,专业词典,专业词库,英汉翻译,打字游戏,火星文,专业字形,符号库等等,想象力可以无穷无尽。其实qq是怎么赚钱的,完全就是卖插件嘛。
目前没有哪家在这方面想,挺可惜的。qq能做的,为什么输入法这种使用频率最高的软件不能做?好比加加那帮人,整天想着“要是百度收购加加就好了”,真没志气~

你用输入法本身去卖钱那肯定是不行的,但换个思路,把输入法本身做的足够好,足够爽,然后以此为平台再开发呢?有大批的人一直在叫“输入法要简单,我们什么功能都不要!不要皮肤,不要软键盘!”~其实看看qq,你觉得花两块钱买衣服的是傻瓜吧,傻瓜还就是多。

当初马化腾混不下去了,想把qq卖给张朝阳,好像就几十万吧,张一想,则免费的鸟东西,我要来干嘛?坚决不干!
这个江湖传闻挺有意思的。

[ 本帖最后由 cqcq 于 2008-3-30 16:12 编辑 ]
作者: 中家    时间: 2008-3-30 16:21
要是紫光拼音能够解决了自造词参与组句的问题,那么紫光就算是正式的整句输入法了,其实词组输入法与整句输入法之间的区别也就仅仅是这里而已,别看这是非常小的一步,要迈过去不是那么容易的事情,目前我知道迈过去了的输入法有智能狂拼、微软拼音,早年的黑马神拼2001也迈过去了,不过迈的步子太大,迈太过了也是跌倒。
作者: kingdick    时间: 2010-7-4 11:08
到现在也不能~




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2