华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 15439|回复: 27
打印 上一主题 下一主题

紫光6.1,我个人认为还不能算是整句输入法

[复制链接]
跳转到指定楼层
1
发表于 2008-1-31 23:19:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
之前的紫光输入法我没有用过,不做任何评价,6.1版(不下载语料库,默认安装)智能化水平还算不错,普通的打字,70%以上的准确率是达到的。但是通过使用,紫光输入法与搜狗、google输入法一样,做的都是静态的智能化。作为整句输入法,最关键的一点就是输入法要在句子中学会适应用户的打字习惯,紫光没有做到。举例如下:
高手,高寿,高手的词频要高很多
“大爷今年高寿”,默认出来的是“高手”,我修正“高手”为“高寿”,接着再输入“大娘今年高寿”,默认出来的还是“高手”,继续输入“他大爷今年高寿”,默认出来的还是“高手”,据此类推,你输入一万句话,修正了一万次,默认出来的还是“高手”。
真正的整句输入法智能狂拼就不一样,第三次就记住了“今年高寿”这个组合。
而且使用静态智能化的输入法有一个很大的副作用,为了满足更高的准确率,用户会不自觉地遵循你的静态智能化标准去说话打字,坚持这样的路子开发下去,会害了广大的紫光拼音输入法使用者。

没有自学习的静态智能,不能说是整句输入法的智能化,更加不能说是引领整句输入,会让人笑话的。
2
发表于 2008-1-31 23:24:52 | 只看该作者
也就是微软拼音才搞真正意义上的整句吧,以前的黑马也沾点边,起码有时在打了七八个字后,开头的词偶尔会变得面目全非。现在的几种所谓智能整句输入法都是智能短语串烧而已,以词频为基础的算法大概做到这一步就算遇上瓶颈了,别要求太高。再往上就完全属于深入研究语言学的范畴了,估计短期内不会有大的突破。

[ 本帖最后由 hualuoqu 于 2008-1-31 23:30 编辑 ]
3
 楼主| 发表于 2008-1-31 23:31:58 | 只看该作者
智能狂拼3.3迷你版,安装程序才3.7兆,安装之后也没有多大,可以说是输入法自带的语料数据很少,要像你们那样比较静态的智能化,狂拼肯定比不过所谓的搜狗、google、QQ、紫光6.1、拼音加加等。但是对于我这个特有的用户而言,我笔记本上安装的这个智能狂拼3.3迷你版,其智能化水平是很高的,因为经过一段时间的打字,这个输入法已经快速适应了我说话打字的口气。
说到适应用户的打字习惯,考虑最完善的应该是微软拼音,建议紫光输入法的开发者认真研究一下微软拼音,用一用智能狂拼,不会用的话,请多看看帮助,当然不想引领整句输入就不需要了 :)
4
 楼主| 发表于 2008-1-31 23:38:13 | 只看该作者
原帖由 hualuoqu 于 2008-1-31 23:24 发表
也就是微软拼音才搞真正意义上的整句吧,以前的黑马也沾点边,起码有时在打了七八个字后,开头的词偶尔会变得面目全非。现在的几种所谓智能整句输入法都是智能短语串烧而已,以词频为基础的算法大概做到这一 ...


用过黑马,黑马的自学习有缺陷,黑马不是没有自学习,而是学习得太过了,过犹不及啊。整句输入法很大的一个困难在于如何寻求一个最佳的自学习速度,是变速学习还是匀速学习等等,均有很深的学问在其中,整句输入法不是那么容易就能引领的。
5
 楼主| 发表于 2008-1-31 23:57:49 | 只看该作者
不支持辅助码,词组输入不如拼音加加老辣,没有快速修正手段,没有自学习功能,与自然码、智能狂拼等高端整句输入法差距更远。但愿紫光开发组能踏踏实实,不要步搜狗吹牛的后尘。卸载中……
6
 楼主| 发表于 2008-2-1 00:01:39 | 只看该作者
居然不带一个方便的卸载程序,给人一种不地道的感觉
7
发表于 2008-2-1 09:03:26 | 只看该作者
这个帖子还是有些技术含量的,希望开发组下一步能重视智能的算法问题。
佳佳很多年前就专门研究过智能算法问题,中家是狂拼的资深用户,这里的举例是最简单的,希望开发组能和他们多交流。
如果造词“今年高寿”,则相关的句子都会正确;如果不专门造词,但“今年高寿”在句子中出现3次之后,则自动造词进入词库(或语料库),也能达到手工造词的效果。这种自学习能力实际是补语料库之不足。
以前一个帖子中所提到的“亟需……认同”、“显露……积弊”等“隔空对接”问题,阿门大师认为算法也很简单,就是从专门库中搜索对应的拼音串;我理解是:亟需……认同,jixu*rentong,这个专门库中的拼音串中需要一个通配符“*”。这种常用的隔空对接词在《现汉》中并不多,只有几百条而已。不同词性的词之间大概也有这种对接规律,可以慢慢摸索,逐渐积累资料。解决好隔空对接问题,应能使识别率提高一大截。
8
发表于 2008-2-1 09:13:26 | 只看该作者
原帖由 中家 于 2008-1-31 23:19 发表
之前的紫光输入法我没有用过,不做任何评价,6.1版(不下载语料库,默认安装)智能化水平还算不错,普通的打字,70%以上的准确率是达到的。但是通过使用,紫光输入法与搜狗、google输入法一样,做的都是静态的智能化 ...


还不觉得狂拼够傻么,第三次才记住?

至于关联词那种东西,目前的智能算法并没有启用那些,应该可行,只是还没做而已.相对于单字,关联词的准确率确实要高一些.

关联词确实会使问题复杂化,而这种对接,除了固定搭配的那些关联词,还有一部分,从语法上讲,叫做补语,往往就把问题复杂化了.然而智能整句算法都不采取语法规则进行计算,这方面的研究也略显不足,至少我从来没有从语法角度去研究这个算法.

[ 本帖最后由 真拼音佳佳 于 2008-2-1 09:19 编辑 ]
9
 楼主| 发表于 2008-2-1 11:43:01 | 只看该作者
原帖由 真拼音佳佳 于 2008-2-1 09:13 发表


还不觉得狂拼够傻么,第三次才记住?



请看4楼,希望你能看得懂。
10
发表于 2008-2-1 15:07:14 | 只看该作者
原帖由 中家 于 2008-2-1 11:43 发表


请看4楼,希望你能看得懂。


http://www.tiansuo.com/websay/ViewTopic.aspx?tid=2936

我想你也能看得懂.

不要把测试不通过的理由推给使用者.我所用到的智能狂拼就是记不住词的输入法,给我的感觉就是:ABC比智能狂拼强.
11
发表于 2008-2-1 22:01:40 | 只看该作者
原帖由 真拼音佳佳 于 2008-2-1 15:07 发表


http://www.tiansuo.com/websay/ViewTopic.aspx?tid=2936

我想你也能看得懂.

不要把测试不通过的理由推给使用者.我所用到的智能狂拼就是记不住词的输入法,给我的感觉就是:ABC比智能狂拼强.


真不知道你是真的弄不明白呢还是装作不懂,看你也是输入法界的有名的人士了,不应该没弄明白狂拼的三次的问题吧。不嫌罗索我在重复一遍;狂拼只要输入过一次就可以记住你输入过的词句,关于这点你可以打开《输入时在缓冲行直接显示联想词语》就明白了,至于你说的三次只不过是被输入法收录到词库当中的词,这么做的目的就是过滤垃圾词。好像加加也有这个功能吧。
12
发表于 2008-2-2 09:25:48 | 只看该作者
原帖由 NOD32 于 2008-2-1 22:01 发表


真不知道你是真的弄不明白呢还是装作不懂,看你也是输入法界的有名的人士了,不应该没弄明白狂拼的三次的问题吧。不嫌罗索我在重复一遍;狂拼只要输入过一次就可以记住你输入过的词句,关于这点你可以打开《输入 ...


加加在任何时候都是只打一遍就能记住词.
虽然有一些选项但不是默认的,比如"不记忆智能组词",勾选之后对于首选智能组词输出后不会记忆,还有禁用调频之后不会记忆词组.另一个丢词的可能是在用户库存满之后,用户词库大小限制的选项,限制,双倍,不限.我的习惯是打字词但我设置为不限,一般的,对于打句子习惯的,用户库增长速度快,可以设为限制,使得长句自动遗忘.


对于智能狂拼,我要说的是:三次才记住,根本就是wow的一厢情愿,他以为这样可以让输入法变的更好使,而实际情况恰恰相反,如果不能够只打一遍就记住,或者不能够记住全部的句中词,输入法不会好使.

不光是wow,你们所有的狂拼用户对于烂尾词的认识程度太差了,缺乏烂尾词的衔接,整句识别率是很低的.
13
发表于 2008-2-2 15:43:05 | 只看该作者
智能狂拼,本人以前一直使用它。

在紫光出了5.0以前,搜狗出了2.0以前,说实在的,智能狂拼是最好用的整句输入法,使用的版本是智能狂拼1.0和智能狂拼2.0,平心而论,智能狂拼1.0比2.0好用;至于以后的智能狂拼3已经面目全非了不再使用它了!

整句输入法,智能狂拼是开创了一个时代,当时所谓的“微软输入法”好像还没有出世,这一点功绩是不能够抹杀的。

现在的我,主要使用三种紫光、Google、搜狗,其余的偶尔会使用QQ拼音输入法
14
发表于 2008-2-2 16:50:36 | 只看该作者
大家跑题跑太远了,变成了狂拼和加加对砍。
15
发表于 2008-2-3 22:48:18 | 只看该作者
楼主的文章很有启发,对咱的评价也很中肯。

确实,想“引领”潮流是极其艰难的,我在论坛中表达过的这种意思,其实是有上下文的——仅仅是通过大量统计数据说明,在命中率上超越了之前的目标(GG),对比这3G,实打实地做到了这个比率最高。

本人绝对没有藐视其它大作的意思,且表示过由衷的敬意,更不敢说在诸多方面能够“引领”,但有这个愿望继续努力。

客观地说,在各个论坛中这个话题的帖子中,可以看出,真正懂得整句输入原理的人不多,不少人眼睛盯到了“词频”这个指标,其实,词频在整句输入中的作用是存在,但不是主要因素,而是若干次要因素中的一种,前些天上传的多种规格的数据资料文件中存放的也不是词和词频,跟词库完全不同,具体是什么?有些一言难尽,也有些要保密。
16
发表于 2008-2-4 14:44:31 | 只看该作者
原帖由 hualuoqu 于 2008-2-2 16:50 发表
大家跑题跑太远了,变成了狂拼和加加对砍。


哈哈!开辟了第三战场!有趣!
17
发表于 2008-2-4 15:14:46 | 只看该作者
的确如此,词频只是对字词方式起很大的作用,但对于整句,起的作用不是主要的。我也不懂整句里边的内涵,只是就逻辑上来说点。
18
 楼主| 发表于 2008-2-4 21:24:26 | 只看该作者
原帖由 hualuoqu 于 2008-2-2 16:50 发表
大家跑题跑太远了,变成了狂拼和加加对砍。


本来不想搭理那个拼音佳佳的,只是诚心诚意来紫光论坛发的第一个正经讨论技术的帖子,被这个草包这么胡搅,拼音加加开发组所依赖的拼音加加论坛有这么一位贵宾,有众多技术高深“大师”,所有技术讨论永远会被他们搅黄,所以我也就回了他一句。如果我是论坛的版主,是不会允许在正经讨论的帖子里面胡搅蛮缠的,这样会让人生厌而不想说真话。
19
发表于 2008-2-5 09:39:48 | 只看该作者
原帖由 hualuoqu 于 2008-2-2 16:50 发表
大家跑题跑太远了,变成了狂拼和加加对砍。


你说错了,是大家都看砍狂拼,我凑个热闹罢了.四哥无意间对狂拼又伤害了一次,他的对照测试把狂拼除名,这种情况下,我再说狂拼如何如何,显得不那么孤单了.
20
发表于 2008-2-5 09:47:06 | 只看该作者
1.狂拼应该放弃"打过3次才记词"的想法.
可行的做法是:打过的一句话,记住这句话6字以内的全部排列组合,并且用过先见(类似于加加,用过就先见,不是高频先见).
换种说法就是:还不觉得狂拼够傻么,第三次才记住?

2.打过的东西都要记住,连ABC都能做到的功能,狂拼做不到?


狂拼不改变这一点,只会越来越差劲.现在连词输入法都可以玩整句输入了,据说谷歌效果不错,QQ我测过也很满意,但是我依然会说:打整句,狂拼一塌糊涂,紫光不如QQ,加加需要强化.

我说紫光不好,我说智能性方面QQ比紫光强大,紫光的四哥都没生气,是吧
21
发表于 2008-2-5 11:00:24 | 只看该作者
不是这样的,四哥很生气,但更多的是怜悯,抛开你的结论是否如我所愿,仅对你形成结论的方法深深不满,这不是一种科学严谨的方法,生气之处不在于你“在错误的路上越走越远”,而是”诱导“良民”跟着你在错误的路上越走越远“。

本着”刻苦“的客观态度,咱对你的说辞择善而从,上两帖中正确的一句话是”无意间对狂拼又伤害了一次“,这个”无意“很关键,具体我是如何形成那个观点的,和测试命中率的方法大有关系,非三言两语能够说清楚。
22
发表于 2008-2-5 13:37:02 | 只看该作者
用过那么多输入法,我觉得大家真的应该去试试Google,开始用你可能真的觉得这并不是个很好的输入法,我一开始也是跟着紫光一起用,后来就慢慢摒弃紫光了,Google的智能我觉得比其他都强,稳定性,兼容性更是在其他之上,整句输入的准确率也很高,而且人家好像还没出过正式版.
23
发表于 2008-2-5 13:55:08 | 只看该作者
原帖由 ZXD4G 于 2008-2-5 11:00 发表
不是这样的,四哥很生气,但更多的是怜悯,抛开你的结论是否如我所愿,仅对你形成结论的方法深深不满,这不是一种科学严谨的方法,生气之处不在于你“在错误的路上越走越远”,而是”诱导“良民”跟着你在错误的路上 ...


嗯,我说了我只是评测,只做最终结论而不会给出过程.有些事你也不会说出来的,我一样.

我做了什么样的评测,为什么能得出谁好谁坏的结论,这些都是有依据的.

事实上你也只看到了我的结论,而我形成结论的方法,我都没有告诉你,你所谓的"深深不满",应该不关我事.你想的和我想的事情肯定不是一件事...唉,反正评都评了,你要是QQ开发人员这次不就满意了么,因为我说QQ好,没说紫光好,呵呵

至于测试方法嘛,你的那种方法我没说不认同啊,现在只是你还没有认同"我测一句等于测一万句"的方法而已.我的测试方法绝对正确,只是测试过程一般人我不告诉他.
24
发表于 2008-2-7 13:39:36 | 只看该作者
加加和四哥之“殊途”,其实正是“百家争鸣”之故。若哪位“服了”另一位,我倒是觉得不正常了。

不正常之处在于,加加更加“偏锋”而已。

老老实实做自己的事,用户量是最好的评价。最好的技术往往不是最适合实际使用的~~
25
 楼主| 发表于 2008-2-13 09:03:48 | 只看该作者
争鸣也要有一点理据,在别人清晰的理据面前,服一下别人又如何?紫光四哥的观点就很不错,能够正确认识到词频在整句输入中的地位,这一点比拼音加加论坛的大师们强。祝愿他保密的算法能够在新的一年中早日实现,关于这个算法的保密我想多说一句,如果真的很经典,建议去申请专利,不管你的算法多么经典高深,只要你实现出来了,在众多编程高手眼里,我想是保密不住的,除非人家不用心去分析。
26
发表于 2008-2-13 11:32:53 | 只看该作者
我的那种方法根本不是什么新鲜东西,都是别人用过的我总结一下罢了.得益于我打一句话就能看出算法.
27
发表于 2008-2-13 12:06:51 | 只看该作者
打一句就能看出来算法真的准吗,那是有点经验论的意思了.某些句子可能这个输入法能完全打出来,而另外一个输入法就打不出来,反过来也是一样.所以单凭某个句子是验证不了输入法算法准确性的.正确而科学的算法是用取材广泛的多数句子来验证.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 07:20

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表