华宇拼音输入法论坛
标题:
紫光华宇拼音词库工具的功能选择
[打印本页]
作者:
sanwsw
时间:
2008-3-5 09:25
标题:
紫光华宇拼音词库工具的功能选择
近日浏览拼音加加论坛,看到有词库工具专帖,十分羡慕加加用户维护、制作词库工具之丰富。紫光华宇拼音输入法论坛冷清,人气指数下降,与紫光缺乏灵活的独立词库工具有相当大的关系,为此特别建议开发组和懂得软件编程的高级紫光用户能够尽快开发功能相对全面的词库工具。不揣冒昧,提出这个工具一些必要的功能,大家共同推选,供开发人员参考。
[
本帖最后由 sanwsw 于 2008-3-5 09:27 编辑
]
作者:
野风
时间:
2008-3-5 11:58
虽然我不用,但帮你顶一下!
作者:
ZXD4G
时间:
2008-3-5 12:22
这些确实是词库制作、整理、勘校时必要的功能,紫光华宇大部分都有,另外也有一些特别的,不过主要是命令行工具,追求处理的效率,不便大众使用,所以,这个月本人有一项任务,就是对已有的工具进行两方面的改进:
1.整合——原来有接近二十个程序,想合并成一个,通过参数去区分不同的功能
2.优化——提高处理速度,以及个别工具的处理质量,如注音工具
说实话,这两个方向的努力过程中有冲突之处,要想高效和高能,很多时候得放弃图形化展示,大致的想法是先追求效率,毕竟不期望太多的人在这些文字整理的枯燥中耗费精力,因此,把这些工具的用户定位在老手范围,估计这个人群应该有一定的操作能力。
在早期的作品中,曾经挑出了几个来给风版和yaClear(清一词库作者)试用,起到了一定效果,但仍不够理想,所以,进行优化整合是必要的,爱好者们也不必急于索要那些零碎的小东西,再等待一些日子吧,本月底之前应该可以发布出来第一个版本。
根据咱的设想,老戴列出的十个还不够丰富,或者还应有一些功能扩充,例如第一条和第二条,感觉上应该包含并集、交集、差集、笛卡尔积等集合运算,第四条和第五条可以结合,即排序因子不限为一个,还有一些关于统计分析方面的功能,等等。
另外,第十条“提取纯词条”的含义不解,望释明。
作者:
步虚
时间:
2008-3-5 12:27
“十分羡慕加加用户维护、制作词库工具之丰富。”
有同感。
左总的留言更让人高兴。充满期待。
作者:
sanwsw
时间:
2008-3-5 12:34
“提取纯词条”
这项功能主要是在“拿来”其他输入法的文本格式词库时用,比如删除单字词、拼音字母、行尾空格、隔音符号和词频数字。当然这些都可以用Word、Excel分步实现,但毕竟操作麻烦。
作者:
野风
时间:
2008-3-5 15:08
原帖由
步虚
于 2008-3-5 12:27 发表
“十分羡慕加加用户维护、制作词库工具之丰富。”
有同感。
左总的留言更让人高兴。充满期待。
的确!从四哥的发言看,紫光输入法正在雄起!我为之感到高兴!
作者:
yiwon
时间:
2008-3-5 18:17
四哥的那些工具用过,都是在dos下用的,有些是十分实用的,但是实用起来确实有点不习惯,呵呵
作者:
yiwon
时间:
2008-3-5 18:31
感觉还应该添加一个功能,
现在在网上找的一些原始词条,一般都是一些汉英词条
就是前面是汉语,后面是英语,活着前面是英语,后面是汉语的那种
希望可以添加一个功能,就是可以分离汉字与英语单词
使他们分离开
另外就是希望可以添加一个剔除单字以及符号的功能
或者说是在有标点符号的地方自动分行,并去掉标点符号
这样处理原始词条的时候就方便多了
[
本帖最后由 yiwon 于 2008-3-5 18:35 编辑
]
作者:
kingdick
时间:
2008-3-5 19:18
yiwon有想法~~
软件能够编辑的词条数也是一个重要指标,有人摆弄好几百万词条,希望出的软件不会让这些大师失望!!
作者:
qlln
时间:
2008-3-9 12:27
我个人觉的这些工具更适合于玩,而不是用。真正用这些工具的人大多数应该是时间富裕的厉害,专著于作输入法或者相关行业的人,并不是大众。加加论坛上热闹的厉害也就是那么几个人每天在折腾,对于这些人来说,这些工具可能是非常有用的,没事就是在做词库,除了作词库也没其他事,对于一般使用者来说,这些工具没有任何意义。一个输入法不要弄的除了靠词库活着还要靠制作词库的工具活着,太累了。作这行的某几个人用用,耗费耗费精力就可以了,何需全民皆兵?当然不是反对做出这些程序的人,还是下了很大功夫和热情的,他们的努力是值得肯定的,也给实际带来不少方便,但反过来还是要说,这些工具真正有多少人在用?值得大力推广么?
作者:
paulzane
时间:
2008-3-10 18:44
合并和提取词条比较重要,不愿意挂的词库数量太多了
欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/)
Powered by Discuz! X3.2