举报
原帖由 ZXD4G 于 2008-7-24 19:42 发表 有必要正名一下有感“语料”一词正在被滥用,故说明一下。 本话题提及的大文件,称之以“模型库”或“模型文件”比较恰当;尽管“语料”有生熟之分,总的来说还是像文本,保证兼容性(大家都看得懂),一般来说,加工不会太深入,也并不专用于某一款软件。
原帖由 步虚 于 2008-7-26 01:24 发表 个人觉得,语料库的大小对上屏速度其实不会有太大的影响,关键还是对所用系统本身的优化(尽可能关掉或少启动一些不必要的程序)。 本人用的机子是老掉牙的Dell Pentium III + 512MB的内存。因为噪声特别小,估 ...
原帖由 cqcq 于 2008-7-26 21:38 发表 其实紫光应该直接推出普通语句库的正式版和大语句库的加强版,这样比较方便。 另外等紫光可以自造词参与组句再试用了,每个人都有自己的输入环境,自造词不能组句的话,实际体验还是很欠缺的。这个不是靠语句库有多 ...
原帖由 岳家军 于 2008-7-26 22:08 发表 如果条件不成熟,我反对用户词库参与组词。否则用了一段时间就会因为词频调整造成智能水下降,会被人误解成智能差的输入法。
原帖由 cqcq 于 2008-7-27 17:55 发表 所谓的智能性,首先体现在用户本身的使用环境上,而不是看人民日报准确率。 用户环境的特点就是1.口语化多。2,随想随打,断句多。3,用户特有词汇多。 很久以前我在文章里就分析过自造词组句的问题,其实大多数 ...
原帖由 野风 于 2008-7-29 14:59 发表 咦?最大的下载量怎么不成套啊?这下载了干什么啊?
原帖由 苗苗老师 于 2008-7-29 16:22 发表 大型语言模型库是什么?
原帖由 岳家军 于 2008-7-29 15:30 发表 只有一种解释,可能下载一个或两个的时间都很长,心想:太大了,算了吧。就没有下载第二个或者第三个了。
原帖由 野风 于 2008-8-1 12:01 发表 实际上是多虑了!用bestdata 和gooddata 在我的赛扬1.4 的机器上感觉是完全一样的!语言模型库似乎对机器的配置要求不高的!在这台老机器上用bestdata 和我的配置好的台式机上用,感觉不出什么。
原帖由 net 于 2008-8-3 17:46 发表 导入最大的那个模型库后,你先敲几个拼音,然后再按Backspace键来去掉这些拼音看看,是不是又慢又卡? 最小的那个就没有问题,流畅得很。
本版积分规则 发表回复 回帖后跳转到最后一页
小黑屋|手机版|Archiver|华宇拼音输入法网站
GMT+8, 2022-7-7 19:08
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.