| 真的会用得到32个吗,我现在还是紫光默认词库配置 |
|
本帖最后由 wangyanhan 于 2012-9-6 13:36 编辑 回风管: 这是很久以前,在加加论坛一则讨论加加词库容量的帖子上看到的,只有许传友提及此事。许传友好像是在齐齐哈尔汽车集团公司办公室工作,又一直是加加官方词库的作者,究竟为啥要使用那么大的词库,我也不太清楚。呵呵! 500万的词库我确实测试过,是用(446万郑文宇狂句+180万朔风飞扬大词库+67万古陶瓦优化基础库)测试的。 我本人使用的,是(67万古陶瓦优化基础库+180万朔风飞扬大词库)。 |
|
本帖最后由 wangyanhan 于 2012-9-5 20:23 编辑 哦!你可能问及的是加加词库容量。 我不是专业打手,但属短句输入派,在实际使用中,词库一般为200——250万,已感到很满足了。 对导入500万的词库进行过测试,导入时间稍长些,估计不超过1分钟,具体时间值没记录。在这种环境下,候选上屏非常流畅。 据原加加版主、加加官方词库作者许传友介绍说,他经常使用1000万的组合词库,加加的输入性能仍然很好。但超过1000万后,就有些问题了。不知他说的问题,是指导入问题呢,还是指输入问题。 |
|
本帖最后由 wangyanhan 于 2012-9-5 00:20 编辑 1、导入词库慢是个事实。它和紫光词库的运行机理不同,拼音词库里的词库文件,只相当是一个词库仓库,不直接参与输入。在导入词库文件时,它就进行扫描,把词条数据读到用户文件夹的缓存词库中去,由这个缓存词库中的词条参与输入。就是在导入拼音词库时,将其读到个缓存词库中的时间长。不过200多万的词库,导入还是很快的。 2、是可以直接使用无注音的txt词库文件,也是要读到用户文件夹的缓存词库中去参与输入。但无注音的txt词库文件不好,输入法按默认注音输入,对多音字就容易出错。用张文焕的词库工具注音,也是很快的。 ![]() |
|
紫光的自定义短语是没有优化的,只能做简单的查询,如果容量太大,会影响系统性能。 可能以后会考虑对其做查询方面的优化,这样就能支持更大的短语库。 |
|
本帖最后由 wangyanhan 于 2012-9-4 21:13 编辑 楼主在加加那边的时间比较多,对加加的情况应该是很清楚的。 按加加的是输入性能讲,是非常优秀的,导入大于500万的词库,输入如飞。但它使用的自定义编码词库也不能太大。 这可能与整个程序结构有关,我估计改进起来是个非常啰唆的事情,呵呵! |
|
本帖最后由 wangyanhan 于 2012-9-4 20:35 编辑 5M的短语库够大了,它又不像拼音词库要对每个字注音。 太大了会影响候选上屏响应速度的。 ![]() |
|
所有短语库总容量为5M, 单个短语库容量最大2M。 我觉得这个规定最好改为: 所有短语库总容量为5M, 单个短语库容量最大5M。 |
本帖最后由 紫光蓝天 于 2012-9-4 20:41 编辑 ![]() |
|
无论是词库还是短语库32个应该足够了吧 假如真的有超过32个词库或短语库,你可以合并啊 |
| 置顶栏有意见集,可以到那里给意见啊。 |