华宇拼音输入法论坛

标题: 您喜欢多大的词库? [打印本页]

作者: 紫光蓝天    时间: 2012-10-20 09:48
标题: 您喜欢多大的词库?

作者: michsun    时间: 2012-10-20 10:04
70W,差不多了!再大也没用~
作者: richardfsw    时间: 2012-10-20 10:41
这帖子挪到这儿来了啊……
作者: 紫光蓝天    时间: 2012-10-20 10:44
@richardfsw
增加一下这里的人气
作者: ljdqe    时间: 2012-10-20 10:53
缺少选项
现在使有系统自带的,之前是一个各种大词库,词库大对输入准确率的帮助很大
不过近期的紫光“智能性”提高明显,使有系统自带的词库也不错
作者: 紫光蓝天    时间: 2012-10-20 10:56
@ljdqe
请问你想选多大的啊
作者: richardfsw    时间: 2012-10-20 11:01
紫光蓝天 发表于 2012-10-20 10:44
@richardfsw
增加一下这里的人气

但貌似不符合板块标题哈

我觉得分太细了,可以这样,0-10,10-30,30-50,50-75,75-100,100-150,150+
作者: ljdqe    时间: 2012-10-20 11:06
紫光蓝天 发表于 2012-10-20 10:56
@ljdqe
请问你想选多大的啊

有没有50W?  *^_-*  ,只要程序的智能性做得好,或者说语言模型好,就能满足要求


作者: 紫光蓝天    时间: 2012-10-20 11:08
@richardfsw
我觉得对词库的大小研究也算汉字研究
10-30,30-50,你这样排列,一是不精确,二是30万的不知选哪个好呀
作者: ljdqe    时间: 2012-10-20 11:08
richardfsw 发表于 2012-10-20 11:01
但貌似不符合板块标题哈

我觉得分太细了,可以这样,0-10,10-30,30-50,50-75,75-100,100-150,15 ...


转到输入法使用版块去?
在不到第七版图,就符合版规了     ^_^
@紫光蓝天  
作者: 紫光蓝天    时间: 2012-10-20 11:21
@ljdqe
我觉得词库大小的研究属于中文研究的一个内容,故放到了这个板块
作者: 紫光蓝天    时间: 2012-10-20 11:25
@ljdqe
你想选50万,那就选50多万呀,也不缺你的选项啊
因为谁的词库也不能做到50万整呀,肯定会多若干条啊
作者: richardfsw    时间: 2012-10-20 11:30
紫光蓝天 发表于 2012-10-20 11:25
@ljdqe
你想选50万,那就选50多万呀,也不缺你的选项啊
因为谁的词库也不能做到50万整呀,肯定会多若干条 ...

对,所以在我那边,30万的可以选30-50
作者: 紫光蓝天    时间: 2012-10-20 11:35
@richardfsw
按你的说法,30万的也可选10-30,和30-50比起来,误差太大了
作者: 紫光蓝天    时间: 2012-10-20 11:59
@richardfsw
既然选项足够,当然越精确越好啊
作者: wangyanhan    时间: 2012-10-20 13:30
本帖最后由 wangyanhan 于 2012-10-20 13:31 编辑

仅6人投票,能说明什么啊?蓝天版主快施展您鼓动家的才能吧!再炒出个热帖!
作者: wangyanhan    时间: 2012-10-20 13:34
凡浏览此帖者,不投票的呵呵!
作者: 紫光蓝天    时间: 2012-10-20 13:54
@wangyanhan
目前得票:
第一名:十多万、四十多万
第二名:七十多万、一百多万
作者: 野风    时间: 2012-10-20 16:26
已经投过票了,但是忘记回帖了,现在补上!
作者: yanchenpan    时间: 2012-10-20 16:48
没有投票的权利  ̄□ ̄||
我觉得50万差不多
作者: richardfsw    时间: 2012-10-20 17:06
紫光蓝天 发表于 2012-10-20 11:59
@richardfsw
既然选项足够,当然越精确越好啊

精确有好处也有坏处

在投票样本数量并不太多的情况下,模糊一些的选项可以降低数据分析难度,直接得出结论
作者: 紫光蓝天    时间: 2012-10-20 17:09
richardfsw  那倒也是。蓝天老师两次都没@上么,什么情况

@richardfsw
是啊,再@一次看看
作者: 紫光蓝天    时间: 2012-10-20 17:13
本帖最后由 紫光蓝天 于 2012-10-20 17:27 编辑

哦,明白了,@第二次就不显示了

作者: kingdick    时间: 2012-10-20 22:10
自己的词库,大小随意。
作者: 闪电王子    时间: 2012-10-21 18:16
投了票了!

作者: 紫光蓝天    时间: 2012-10-21 18:54
目前得票:
第一名:十多万
第二名:四十多万

作者: yiwon    时间: 2012-10-21 20:42
感觉词库的大小。。对于我来说无所谓,够用就行
我一直在想,将来随着技术的发展,输入法智能水平的提高,是不是可以取消词库的存在,通过输入法自身的智能辨析完全达到无需词库也能流畅输入的效果。。
作者: yiwon    时间: 2012-10-21 21:02
@kingdick,云输入不是没有词库,而是词库在云端。。
另外这输入速度。。。
作者: richardfsw    时间: 2012-10-21 21:42
yiwon 发表于 2012-10-21 20:42
感觉词库的大小。。对于我来说无所谓,够用就行
我一直在想,将来随着技术的发展,输入法智能水平的提高, ...

个人感觉概率不大,因为拼音→汉字是典型的一对多关系。所谓智能性也就是把词库换一种方式存在罢了。因为程序总还是需要知道哪些汉字能够以特定的组合出现

但考虑到每个人输入的差异性(比如人名和专业领域的专用词汇),终究还是(用户)词库来得灵活
作者: kingdick    时间: 2012-10-21 22:58
@yiwon 成功?
作者: 古陶瓦    时间: 2012-10-22 10:10
百万以上的不必自造,还是大一点好。
作者: wangyanhan    时间: 2012-10-22 10:31
很难想象10万的词库如何用,网上质量稍微好一点的词典,词条都在40万以上。
作者: 紫光蓝天    时间: 2012-10-22 10:47
@wangyanhan
但目前得票第一的仍然是十多万的词库
作者: 紫光蓝天    时间: 2012-10-22 12:42
多空双方投票已经白热化

目前得票:
第一名:十多万、一百多万
第二名:四十多万
作者: 好休闲    时间: 2012-10-22 13:14
进来看看,
作者: 纯净吗?    时间: 2012-10-22 13:46
您所在的用户组没有投票权限
作者: 紫光蓝天    时间: 2012-10-22 15:49
目前得票:
第一名:十多万
第二名:一百多万
作者: 野风    时间: 2012-10-22 16:03
两极分化得如此厉害……
作者: ljdqe    时间: 2012-10-22 19:25
大有大的好,只要程序“受得了”,几百万的词库也没关系
作者: 紫光蓝天    时间: 2012-10-22 19:34
在这个帖子里,我不表达我的观点,只是希望看到一个客观的投票结果
作者: yiwon    时间: 2012-10-22 22:03
成功,元芳,这是为什么呐?
作者: wangyanhan    时间: 2012-10-22 22:13
本帖最后由 wangyanhan 于 2012-10-22 22:20 编辑
ljdqe 发表于 2012-10-22 19:25
大有大的好,只要程序“受得了”,几百万的词库也没关系

我用加加,词库始终是在250万左右,一年内积累用户词库近3万。呵呵!

我的备份是不含用户词库的,有时恢复备份后忘了导入用户词库,不到半分钟,就会发现不对劲啊!
作者: 紫光蓝天    时间: 2012-10-23 07:25
@admin03
取样不是问题
已经快20票了
再过一段时间
200票都可能
作者: 紫光蓝天    时间: 2012-10-23 07:48
帖子里反映级别低的没有投票权
目前投票的人数虽然不足二十名
但是这些人全部都是重量级人物
投票的客观性还是毋庸置疑的


作者: 紫光蓝天    时间: 2012-10-23 07:55
目前得票:
第一名:十多万
第二名:四十多万、一百多万
作者: lionman    时间: 2012-10-23 10:45
最近用着野风17万的精确词库,感觉不错!
所以投了十多万的……
作者: richardfsw    时间: 2012-10-23 12:13
紫光蓝天 发表于 2012-10-23 07:48
帖子里反映级别低的没有投票权
目前投票的人数虽然不足二十名
但是这些人全部都是重量级人物

非投票发起人似乎没法儿看到具体的投票参与情况诶……
作者: 紫光蓝天    时间: 2012-10-23 13:15
@richardfsw
看不到投票参与人没什么遗憾的
论坛上以前的投票不都是这样吗
想让你知道投了哪个票的人
自然会在本帖中说明
不想让你知道投了哪个票的人
自然不会在帖子中说明
作者: 紫光蓝天    时间: 2012-10-23 17:53
多空双方再次两极分化

目前得票:
第一名:十多万
第二名:一百多万
作者: IcyJuice    时间: 2012-10-24 07:32
投了十来万的那条一票
作者: 紫光蓝天    时间: 2012-10-24 11:11
排行榜

第一名(7票)十多万

第二名(5票)一百多万

第三名(4票)四十多万
作者: 紫光蓝天    时间: 2012-10-24 18:12
@admin03
你说的那个是在Linux下用的啊。虽然我没法帮你测试,但你只要在它默认的双拼方案下修改即可。
作者: richardfsw    时间: 2012-10-24 22:56
@ljdqe

嗯。记得金山论坛的设定是,点评必回复。只显示回复内容的前面部分(如果很长)作为点评
作者: 紫光蓝天    时间: 2012-10-25 09:59
@admin03 搜一搜就知道修改办法了,好多人都说修改成功了。目前我用过的输入法,并未发现无法修改双拼方案的
作者: 紫罗兰    时间: 2012-10-27 17:07
最近一直在用野风的17万词库,感觉不错!
所以投了17万的票!
作者: 紫光蓝天    时间: 2012-10-28 14:53
排行榜

第一名(9票)十多万

第二名(6票)一百多万

第三名(4票)四十多万
作者: 樵夫    时间: 2012-10-29 07:34
投票!投票!投了十多万的票!
支持精悍的词库!
作者: 紫光蓝天    时间: 2012-10-29 07:58
热烈祝贺
第一名(10票)十多万

作者: 好休闲    时间: 2012-10-29 08:33
继续关注
作者: 野风    时间: 2012-10-29 20:24
关注中……
作者: wangyanhan    时间: 2012-10-29 21:17
野风 发表于 2012-10-29 20:24
关注中……

呵呵!俺们都在关注中……

比较风管两个词库的下载量,30万不比17万少。这少量人的投票,不见得就能反映全貌啊!


作者: 紫光王子    时间: 2012-10-30 18:34
投票了!
作者: 紫光蓝天    时间: 2012-10-30 19:17
排行榜

第一名(11票)十多万

第二名(7票)一百多万

第三名(4票)四十多万

作者: ziguang    时间: 2012-11-2 07:39
作为一个紫光的老用户,一直在用老版本,今天特地来更新新版本的。一进来就看到了野风17万的词库,正合我意。本想静静地来,静静地走,正巧浏览到汉字研讨版块,进来看到这个帖子,忍不住投了一票,留了一个脚印!
作者: 紫光蓝天    时间: 2012-11-2 08:42
排行榜

第一名(13票)十多万

第二名(7票)一百多万

第三名(4票)四十多万

作者: 野风    时间: 2012-11-4 19:38
投票的人不多啊!
作者: 好休闲    时间: 2012-11-4 19:58
主要是到底哪个好,还在思考……举棋不定呀。
作者: 野风    时间: 2012-11-4 20:18
自己的感觉最重要!哈哈!
好休闲兄!
作者: 樵夫    时间: 2012-11-23 08:50
看看有没有新的结果!
作者: cdrwking    时间: 2012-12-15 20:16
有没有超级词库,越大越好。
作者: wangyanhan    时间: 2012-12-15 21:34
本帖最后由 wangyanhan 于 2012-12-15 21:38 编辑
cdrwking 发表于 2012-12-15 20:16
有没有超级词库,越大越好。


有啊!紫光超大词库“蛇语者1.0”版,词库总数为161万条。
http://bbs.unispim.com/forum.php?mod=viewthread&tid=2346

如果你还嫌小的话,可在我的“加加紫光共享”网盘下载“郑文宇狂句1.2版”_词条数:429万多条。不过是加加txt格式的,需要自己转换呵呵!
作者: cdrwking    时间: 2012-12-16 19:01
wangyanhan 发表于 2012-12-15 21:34
有啊!紫光超大词库“蛇语者1.0”版,词库总数为161万条。
http://bbs.unispim.com/forum.php?mod=vie ...

谢谢^_^
作者: vip    时间: 2013-3-13 12:38
长时间以来,一直默默地使用着野风精确词库!
作者: 紫光蓝天    时间: 2013-3-20 22:39
排行榜

第一名(14票)十多万

第二名(7票)一百多万

第三名(4票)四十多万
作者: 闪电王子    时间: 2013-3-30 10:07
紫光蓝天 发表于 2013-3-20 22:39
排行榜

第一名(14票)十多万

我想也是应该这样的!
作者: cdrwking    时间: 2013-4-30 23:55

目前暂时够用了……用了超大词库后,用户词库明显小了很多。当然,另一台电脑还是用官方的默认词库^_^


作者: 紫光蓝天    时间: 2013-5-4 14:08
排行榜

第一名(14票)十多万

第二名(8票)一百多万

第三名(4票)四十多万
作者: ljdqe    时间: 2013-5-4 14:16
有趣
两头多
作者: sway    时间: 2013-5-22 10:56
使用野风精确词库的留个脚印
作者: 紫光蓝天    时间: 2013-5-22 12:40
排行榜

第一名(15票)十多万

第二名(8票)一百多万

第三名(4票)四十多万
作者: lionman    时间: 2013-5-25 11:19
第一名几乎要比第二名多一倍了……
作者: fangfang    时间: 2013-5-28 21:46
不能投票!等能够投票的时候再来投票吧!
作者: 紫色流星    时间: 2013-6-17 11:38
wangyanhan 发表于 2012-10-20 13:34
凡浏览此帖者,不投票的呵呵!

呵呵!
作者: fangfang    时间: 2013-7-17 15:05
还没有投票权……
作者: 野风    时间: 2013-7-18 11:55
fangfang 发表于 2013-7-17 15:05
还没有投票权……

积极发帖吧!
实在不行到第七版图去灌溉水也行啊!
作者: 紫光蓝天    时间: 2013-7-20 06:25
排行榜

第一名(16票)十多万

第二名(8票)一百多万

第三名(4票)四十多万
作者: 海鸥    时间: 2013-7-21 20:16
紫光蓝天 发表于 2013-7-20 06:25
排行榜

第一名(16票)十多万

第一名和第二名之比,17︰8!
作者: 紫光王子    时间: 2013-7-31 07:36
海鸥 发表于 2013-7-21 20:16
第一名和第二名之比,17︰8!

呵呵……
作者: wangyanhan    时间: 2013-7-31 08:52
本帖最后由 wangyanhan 于 2013-7-31 09:05 编辑
cdrwking 发表于 2012-12-15 20:16
有没有超级词库,越大越好。
单纯求大没用,还要求质量。

在大词库一类中,我个人觉得“紫光词库”和“华宇大词库完美优化第六版 ”是比较优秀的呵呵!

更大的词库,似乎也不适合华宇拼音输入法使用,因为重码多了,用声调和扩展模式筛选的效率都不高。
作者: 海鸥    时间: 2014-3-30 12:05
终于有投票权了!
作者: 紫光蓝天    时间: 2014-4-2 11:17
第一名和第二名之比,18︰8了
作者: 野风    时间: 2014-4-2 15:29
如果投票的人再多点就好了。
作者: fangfang    时间: 2014-4-3 10:59
还没有投票权……
作者: wangyanhan    时间: 2014-4-8 21:10
完全没有实际意义的动作呵呵!
作者: 紫光蓝天    时间: 2014-4-23 11:53
19︰8
作者: wangyanhan    时间: 2014-4-23 20:59
此贴一年半了,33人投票呵呵!
作者: juecky    时间: 2014-6-4 08:50
希望词库多一些好点,现在有好多流行的新词也能加入最好




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2