华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 12827|回复: 25
打印 上一主题 下一主题

请教一个问题!!

[复制链接]
跳转到指定楼层
1
发表于 2012-9-4 18:37:25 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式





能不能不要限制这些呢?

开放这些闲置。
2
发表于 2012-9-4 18:41:29 | 只看该作者
置顶栏有意见集,可以到那里给意见啊。
3
发表于 2012-9-4 18:43:22 | 只看该作者
无论是词库还是短语库32个应该足够了吧
假如真的有超过32个词库或短语库,你可以合并啊
4
 楼主| 发表于 2012-9-4 20:10:06 | 只看该作者
回复 4# 紫光蓝天


    自定义短语不能超过5M,觉得有点小了
5
 楼主| 发表于 2012-9-4 20:10:22 | 只看该作者
回复 3# 宝宝要努力


    这不是意见,是请教
6
发表于 2012-9-4 20:19:52 | 只看该作者
本帖最后由 紫光蓝天 于 2012-9-4 20:41 编辑

7
发表于 2012-9-4 20:25:27 | 只看该作者
所有短语库总容量为5M,
单个短语库容量最大2M。

我觉得这个规定最好改为:

所有短语库总容量为5M,
单个短语库容量最大5M。
8
发表于 2012-9-4 20:33:22 | 只看该作者
本帖最后由 wangyanhan 于 2012-9-4 20:35 编辑

5M的短语库够大了,它又不像拼音词库要对每个字注音。

太大了会影响候选上屏响应速度的。
9
 楼主| 发表于 2012-9-4 20:45:05 | 只看该作者
回复 9# wangyanhan


    可以开放的大一些,让用户根据需要来定制啊
10
 楼主| 发表于 2012-9-4 20:45:56 | 只看该作者
回复 8# 紫光蓝天


    5M太少了,应该不限量进行压力测试,来判断承受力再来开发或者调整方案
11
发表于 2012-9-4 21:10:47 | 只看该作者
本帖最后由 wangyanhan 于 2012-9-4 21:13 编辑

楼主在加加那边的时间比较多,对加加的情况应该是很清楚的。

按加加的是输入性能讲,是非常优秀的,导入大于500万的词库,输入如飞。但它使用的自定义编码词库也不能太大。

这可能与整个程序结构有关,我估计改进起来是个非常啰唆的事情,呵呵!
12
发表于 2012-9-4 22:06:27 | 只看该作者
紫光的自定义短语是没有优化的,只能做简单的查询,如果容量太大,会影响系统性能。
可能以后会考虑对其做查询方面的优化,这样就能支持更大的短语库。
13
发表于 2012-9-4 23:00:43 | 只看该作者
楼主在加加那边的时间比较多,对加加的情况应该是很清楚的。

按加加的是输入性能讲,是非常优秀的,导入 ...
wangyanhan 发表于 2012-9-4 21:10



    虽然没用过,但加加程序的效率有所耳闻。在某本书里看到的,导入词库的耗时和微软拼音2007短不止一个数量级。貌似是无注音txt也能直接调用?

顺便问一下加加现在是个什么状态?

PS:似乎这事儿应该去加坛问的…………
14
发表于 2012-9-5 00:13:20 | 只看该作者
本帖最后由 wangyanhan 于 2012-9-5 00:20 编辑
虽然没用过,但加加程序的效率有所耳闻。在某本书里看到的,导入词库的耗时和微软拼音2007短不止 ...
richardfsw 发表于 2012-9-4 23:00

1、导入词库慢是个事实。它和紫光词库的运行机理不同,拼音词库里的词库文件,只相当是一个词库仓库,不直接参与输入。在导入词库文件时,它就进行扫描,把词条数据读到用户文件夹的缓存词库中去,由这个缓存词库中的词条参与输入。就是在导入拼音词库时,将其读到个缓存词库中的时间长。不过200多万的词库,导入还是很快的。

2、是可以直接使用无注音的txt词库文件,也是要读到用户文件夹的缓存词库中去参与输入。但无注音的txt词库文件不好,输入法按默认注音输入,对多音字就容易出错。用张文焕的词库工具注音,也是很快的。
15
发表于 2012-9-5 18:44:40 | 只看该作者
1、导入词库慢是个事实。它和紫光词库的运行机理不同,拼音词库里的词库文件,只相当是一个词库仓库,不直 ...
wangyanhan 发表于 2012-9-5 00:13



    感谢解答哈。

PS:不知您是否理解有误差——我原帖说的是,加加(导入词库)的效率远高于微软
16
发表于 2012-9-5 20:21:41 | 只看该作者
本帖最后由 wangyanhan 于 2012-9-5 20:23 编辑
感谢解答哈。

PS:不知您是否理解有误差——我原帖说的是,加加(导入词库)的效率远高于微软
richardfsw 发表于 2012-9-5 18:44


哦!你可能问及的是加加词库容量。

我不是专业打手,但属短句输入派,在实际使用中,词库一般为200——250万,已感到很满足了。

对导入500万的词库进行过测试,导入时间稍长些,估计不超过1分钟,具体时间值没记录。在这种环境下,候选上屏非常流畅。

据原加加版主、加加官方词库作者许传友介绍说,他经常使用1000万的组合词库,加加的输入性能仍然很好。但超过1000万后,就有些问题了。不知他说的问题,是指导入问题呢,还是指输入问题。
17
发表于 2012-9-5 23:01:48 | 只看该作者
哦!你可能问及的是加加词库容量。

我不是专业打手,但属短句输入派,在实际使用中,词库一般为200— ...
wangyanhan 发表于 2012-9-5 20:21



    500万1分钟,真是堪称神速了。据说微软一边注音一边导入,一分钟才导了2000条
18
发表于 2012-9-6 08:44:55 | 只看该作者
500万1分钟,真是堪称神速了。据说微软一边注音一边导入,一分钟才导了2000条
richardfsw 发表于 2012-9-5 23:01



    前两天用微软拼音提供的词库注音工具(Excel+VBA开发的),我的80万词库,用了4个小时,而且对多音字不加区分。
19
发表于 2012-9-6 09:03:17 | 只看该作者
哦!你可能问及的是加加词库容量。

我不是专业打手,但属短句输入派,在实际使用中,词库一般为200— ...
wangyanhan 发表于 2012-9-5 20:21


1000万的词库?
真有那么多的词要经常输入吗?
如果有很多不常用的,让这样的词存在……有必要吗?
20
发表于 2012-9-6 11:21:57 | 只看该作者
本帖最后由 wangyanhan 于 2012-9-6 13:36 编辑
1000万的词库?
真有那么多的词要经常输入吗?
如果有很多不常用的,让这样的词存在……有必要吗?
野风 发表于 2012-9-6 09:03

回风管:

这是很久以前,在加加论坛一则讨论加加词库容量的帖子上看到的,只有许传友提及此事。许传友好像是在齐齐哈尔汽车集团公司办公室工作,又一直是加加官方词库的作者,究竟为啥要使用那么大的词库,我也不太清楚。呵呵!

500万的词库我确实测试过,是用(446万郑文宇狂句+180万朔风飞扬大词库+67万古陶瓦优化基础库)测试的。

我本人使用的,是(67万古陶瓦优化基础库+180万朔风飞扬大词库)。
21
发表于 2012-9-6 18:29:34 | 只看该作者
前两天用微软拼音提供的词库注音工具(Excel+VBA开发的),我的80万词库,用了4个小时,而且对多 ...
kingdick 发表于 2012-9-6 08:44



    差距有点大啊……微软是不是应该考虑优化一下算法……
22
发表于 2012-9-6 19:16:46 | 只看该作者
真的会用得到32个吗,我现在还是紫光默认词库配置
23
发表于 2012-9-6 19:37:50 | 只看该作者
差距有点大啊……微软是不是应该考虑优化一下算法……
richardfsw 发表于 2012-9-6 18:29

微软拼音我没用过,从我使用过的紫光和加加对比,我还是觉得紫光导入词库最快。
不过只测试过250万左右的词库,更多的就没有测验了。
24
 楼主| 发表于 2012-9-7 07:09:06 | 只看该作者
回复 23# 心无镜遥


    对于特殊需要的会用到很多的
25
发表于 2012-9-7 08:58:40 | 只看该作者
真的会用得到32个吗,我现在还是紫光默认词库配置
心无镜遥 发表于 2012-9-6 19:16

如果把短语都分类存放,32个并不算多。哈哈。
另外分类存放有个好处是维护方便,并且可以分类挂接。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-24 23:42

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表