华宇拼音输入法论坛

标题: 智能组词+大词库紫光重夺第一把交椅的钥匙 支持的进来顶 [打印本页]

作者: 永远的紫光    时间: 2007-12-23 12:21
标题: 智能组词+大词库紫光重夺第一把交椅的钥匙 支持的进来顶
智能组词+大词库  紫光要想夺回拼音输入法第一把交椅
还得靠这两样东西
另外的诸如双拼,简拼,等等另外的附加功能还是要在做好
上面两个方面的前期的条件下再完善
搜狗一开始就是靠着他们所说的

超强互联网词库,无所不包利用搜索引擎技术,根据搜索词生成的输入法互联网词库,能够覆盖所有类别的流行词汇。无论是最新的歌手、电视剧、电影名、游戏名,还是球星、软件名、动漫、歌曲、电视节目,全部一网打尽。
先进的智能组词算法,首选词准确率第一最新的智能组词算法应用了领先的搜索引擎技术,分析搜索引擎语料库的语言模型,使搜狗输入法的首选词准确率在所有输入法中居第一。
抢走了一大批用户
  赞同看法的进来顶一个
作者: shardineblog    时间: 2007-12-23 13:55
呵呵。。。不发表评论。
作者: 野风    时间: 2007-12-23 14:02
我觉得“智能组词能力”更重要!词库再大,总有它没有的词。再说那么大的词库,可能许多的词是我一辈子也用不着的词。抛砖引玉!
作者: 落寞的湖    时间: 2007-12-23 18:37
支持楼主!
我有一个超大词库,正在测试,各方条件成熟时,我会发上来!
作者: 落寞的湖    时间: 2007-12-23 18:44
原帖由 野风 于 2007-12-23 14:02 发表
我觉得“智能组词能力”更重要!词库再大,总有它没有的词。再说那么大的词库,可能许多的词是我一辈子也用不着的词。抛砖引玉!   




你的想法非常片面,你才多大?就止步不前?就能预测自己一辈子的事?

我快奔五了,都不敢这样说。

也许你一辈子会用到很多您现在想不到的词!
作者: 野风    时间: 2007-12-23 18:51
原帖由 落寞的湖 于 2007-12-23 18:44 发表




你的想法非常片面,你才多大?就止步不前?就能预测自己一辈子的事?

我快奔五了,都不敢这样说。

也许你一辈子会用到很多您现在想不到的词!


呵呵!你快奔五了,就在我前面卖老了!呵呵!!! 我有“洁癖”,现在连系统词库都干掉了,只用自己的词库。呵呵!再说,即使用到一两次,难道就为了这一两次,让它在我的电脑里躺一辈子?呵呵!我会很难受的!

[ 本帖最后由 野风 于 2007-12-23 19:50 编辑 ]
作者: 落寞的湖    时间: 2007-12-23 19:01
原帖由 野风 于 2007-12-23 18:51 发表


呵呵!你快本五了,就在我前面卖老了!呵呵!!! 我有“洁癖”,现在连系统词库都干掉了,只用自己的词库。呵呵!再说,即使用到一两次,难道就为了这一两次,让它在我的电脑里躺一辈子?呵呵!我会很难受的 ...


呵呵,对不起您老人家!

你老用过大词库吗?如果用过,估计你老用的方法不对。如果没用过,就别说大词库不好!

当然如果你年纪的确很大的话,确实不需要用大词库的!呵呵~
作者: 野风    时间: 2007-12-23 19:08
原帖由 落寞的湖 于 2007-12-23 19:01 发表


呵呵,对不起您老人家!

你老用过大词库吗?如果用过,估计你老用的方法不对。如果没用过,就别说大词库不好!

当然如果你年纪的确很大的话,确实不需要用大词库的!呵呵~


呵呵!正因为我用过,还用了不短的时间,风版的、一清的,才有了发言权。另外,既然是论坛,就应该百家争鸣,你说对不对?就应该容得下别人说好或者说不好!我有什么地方说得不对,还请海涵!
作者: 落寞的湖    时间: 2007-12-23 19:19
还有就是,你认为“智能组词能力”更重要,这也是非常错误的,尤其是在现阶段。因为目前的智能还无法达到一个比较高的准确率。搜狗、谷歌及qq拼音凭借其丰富的互联网语料,都不能在智能组词上有大的突破,紫光可能就更难做到。何况智能组词后的修改的便捷性设计,也是智能组词的一大瓶颈,迟迟得不到解决。据我所知,智能狂拼的下标修改设计,目前算好的,但仍然差强人意。
因此,智能组词也许会是个发展方向,但在可预见的将来不会有什么突破,他只能是起辅助作用,或者作为吸引初级用户眼球的一个噱头!
作者: 野风    时间: 2007-12-23 19:28
原帖由 落寞的湖 于 2007-12-23 19:19 发表
还有就是,你认为“智能组词能力”更重要,这也是非常错误的,尤其是在现阶段。因为目前的智能还无法达到一个比较高的准确率。搜狗、谷歌及qq拼音凭借其丰富的互联网语料,都不能在智能组词上有大的突破,紫光可能就 ...


呵呵!“智能组词能力更重要”应该不错!只是它目前还远远不能令人满意!你说对吗?如果你觉得不中听,我也就不多说了,我并无意在这件事上使你感到不愉快!只是表达了一下我的看法而已。

[ 本帖最后由 野风 于 2007-12-23 19:51 编辑 ]
作者: 落寞的湖    时间: 2007-12-23 19:29
哈哈,风版的、一清的就算大词库?您老真是跟不上趟了!

你知道搜狗、谷歌的词库加上智能语料有多大吗?你知道加加拼音的超大词库吗?就连新出的qq拼音词库和语料也有百万左右。然而,这还不是最牛的,最牛的要算“黑马神拼”了,它的语料库好像超过200m,当然黑马神拼的智能组词也是好的,但仍然没有办法突破!
作者: 落寞的湖    时间: 2007-12-23 19:31
原帖由 野风 于 2007-12-23 19:28 发表


呵呵!“智能组词能力”更重要应该不错!只是它目前还远远不能令人满意!你说对吗?如果你觉得不中听,我也就不多说了,我并无意在这件事上使你感到不愉快!只是表达了一下我的看法而已。   ...



呵呵,没关系的,我喜欢这样的争论,都是希望紫光好!将来我的词库发上来,敬请试用,并请多提意见!
作者: 野风    时间: 2007-12-23 19:37
原帖由 落寞的湖 于 2007-12-23 19:29 发表
哈哈,风版的、一清的就算大词库?您老真是跟不上趟了!

你知道搜狗、谷歌的词库加上智能语料有多大吗?你知道加加拼音的超大词库吗?就连新出的qq拼音词库和语料也有百万左右。然而,这还不是最牛的,最牛的要算 ...


在下斗胆问一下,你知道我用的词库多大吗?今天刚清理掉一些没用的词,才36kb!这就是我的风格!因此,风版的、一清的,对于我来说,就大得不可想象了!记住一点:在这个世界上,并不是每个人都喜欢或者需要大词库!在这个坛子上,只用用户词库的不在少数! 另:我在任何时候,都没有说过要跟上趟,若要跟趟,我就用搜狗了!它的跟趟词语最多了!呵呵!抱歉,还请多海涵!

[ 本帖最后由 野风 于 2007-12-23 19:54 编辑 ]
作者: 野风    时间: 2007-12-23 19:41
原帖由 落寞的湖 于 2007-12-23 19:31 发表



呵呵,没关系的,我喜欢这样的争论,都是希望紫光好!将来我的词库发上来,敬请试用,并请多提意见!


我相信凭你的执着劲,搞出来的词库一定错不了!等你的大词库出来,我一定下载收藏!呵呵!不过还是希望没有伤你的感情!好吗?

[ 本帖最后由 野风 于 2007-12-23 19:55 编辑 ]
作者: tb123321    时间: 2007-12-23 19:55
楼主说的有道理。
作者: fengyu29    时间: 2007-12-23 20:52
大词库是未来的发展的方向.这是无庸置疑的.
作者: 真拼音佳佳    时间: 2007-12-23 22:48
1.智能组词和大词库是两码事.
智能组词,或者说是智能整句算法的优劣,跟词库没多少关系的.在对比测试的时候,一定要剥离大词库的干扰,否则你只是测得了模糊的识别率对比数据,但是你不可能得知高下的原因.

2.词输入法对于智能组词并不需要有多高的期待,智能组词功能的好坏对于输入法效率的影响微乎其微,当然前提是用法正确.非要拿词输入法打句子的人不在少数,但是他们慢并不代表输入法不行.

3.不要去期待机器具备人的思维.机器对于语言的处理算法,跟人脑的算法完全不同.机器存在一个分辨准确率,某些算法的准确率要高一些,某些算法准确率不佳.输入法蒙对了,只有两种可能,要么是智能性好,要么是你的运气好.
要不然,我只打zinen
用模糊音做例子么...我猜你是在想,模糊音启用之后,识别率会降低一半?事实上并非如此.智能算法不会只考虑单独一个音节,从整体分析的话,人脑能够从大量模糊化的音节当中识别出正确的句子,机器也一样可以.识别率只是降低一点点而已,就好像我模糊音全开打词组,首选上屏也只降低很少一点点(这个我是试过的).


为什么说智能组词功能对于词输入法不重要?
目前我的拼音加加用户词库规模是2.6万,用它去除跟系统词库做的交集,剩下的就是我的自造词.有多少呢...我还没算呢,呵呵...再平均到每一天会是几个?

输入法用的是拼音加加,不过自造词的方法每个输入法都差不多的.

当然也有另一个原因,目前智能组词算法能让我满意的,根本就不存在,包括拼音加加.

的确很想为拼音加加的智能组词能力的提高做一些事情...看样子该行动了,呵呵.

智能组词能力的提高,小问题嘛,


寂寞的湖...一个超大词库而已,有必要测试了才放出来?真是想不通啊,难道说,紫光对超大词库支持还是有什么问题么,呵呵...
作者: michsun    时间: 2007-12-24 14:36
智能大词库都不错,也要重视用户使用习惯和不断更新才是上选啊!
作者: kork2006    时间: 2007-12-24 18:54
大词库也不一定
有自己最经常用的就可以了
大了占内存空间
作者: kork2006    时间: 2008-1-4 21:04
词库太大了,启动慢!!!
作者: 真拼音佳佳    时间: 2008-1-4 23:55
原帖由 kork2006 于 2007-12-24 18:54 发表
大词库也不一定
有自己最经常用的就可以了
大了占内存空间


把你的破机器扔了吧

机器的性能决定了软件的潜能.猪永远不可能学会说人话,因为猪脑的潜能跟人脑的潜能不一样.
作者: niechel    时间: 2008-1-5 09:45
沙发!传说中的吧?虽然不用,还是要支持一下的
作者: NOD32    时间: 2008-1-6 13:59
词库不再大,而在与精,其实最主要的还是核心算法,我们都知道自然码,它的普及版安装后的文件只有17mb多点,可他的智能并没有因此而受到影响。所以说提高了核心算法的精准度,充分调动词库里所有的词汇参与组词。
作者: 永远的紫光    时间: 2008-1-6 14:54
说来说去都是同一个意思
作者: 永远的紫光    时间: 2008-1-6 14:54
能更流畅的输入
作者: testmore    时间: 2008-1-6 17:54
= =真是郁闷阿...




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2