华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 18108|回复: 11
打印 上一主题 下一主题

有点想法

[复制链接]
跳转到指定楼层
1
发表于 2010-1-13 12:08:52 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
最近年底忙了,各部门开始写年总的总结与下你一年度的报告了,我也开始大量帮助同事整理他们使用的搜狗词库啊,QQ词库啊。合并到一起在做成紫光的词库。很累 很苦。
不知道紫光是否可以推出一个字库导入的工具,可以导入其它输入法的词库,同时对重复的词条进行删除。 希望能开发出来。
2
发表于 2010-1-13 12:36:34 | 只看该作者
公司全部换用紫光了?呵呵!


应该不可以的,涉及到利益问题。
3
发表于 2010-1-13 13:55:32 | 只看该作者
搜狗词库、qq词库是txt文件么?
如果是,则使用ultraedit-32(排序、去重、通过正则替换去掉拼音等),再使用紫光的“批量造词”辅助工具导入成紫光的词库。

使用熟练,则做这些工作应该在10分钟内搞定。不应该特别辛苦。
4
 楼主| 发表于 2010-1-13 16:02:12 | 只看该作者
明白意思了,就是做文字的词库,用辅助工具作出拼音标注。

SUNMD 我还想提出一个建议,就是在批量造词中能否对标注的词语全部移到词库的最下方,这样也好整理了,要不需要一行一行的查收,很麻烦的。
5
发表于 2010-1-13 16:36:33 | 只看该作者
这个需要等待推出一个比较好的词库维护和整理的工具^_^
6
发表于 2010-1-13 17:31:23 | 只看该作者
我以前用过启程之星的txt词库预处理工具,还不错,速度稍慢点,也不是完全不可忍受.50万左右的大词库,3-5分钟左右就可以完成去拼音和去重复.你可以试试.去掉拼音和和重复词条后,你可以用紫光词库工具的创建词库功能来创建一个词库,然后再将这个词库导出为txt文本,这样就完成了拼音的自动标注了.

启程之星词库预处理.rar

10.5 KB, 下载次数: 644

7
发表于 2010-1-13 18:15:55 | 只看该作者
原帖由 kingdick 于 2010-1-13 12:36 发表
公司全部换用紫光了?呵呵!


应该不可以的,涉及到利益问题。



晕~~
导入TXT也涉及利益
紫光导出TXT就不涉及利益
无语~
8
发表于 2010-1-13 18:57:39 | 只看该作者
原帖由 stwcb2007 于 2010-1-13 18:15 发表



晕~~
导入TXT也涉及利益
紫光导出TXT就不涉及利益
无语~

这都看不懂,人的意思是紫光不好做成可以导入其它输入法的专有词库。至于txt自然是没问题
9
发表于 2010-1-13 21:52:52 | 只看该作者
原帖由 还是支持紫光 于 2010-1-13 18:57 发表

这都看不懂,人的意思是紫光不好做成可以导入其它输入法的专有词库。至于txt自然是没问题


兄弟是在灌水么?
想想罢
不是TXT格式的
楼主怎么整理啊
10
发表于 2010-1-13 22:04:18 | 只看该作者
原帖由 stwcb2007 于 2010-1-13 21:52 发表


兄弟是在灌水么?
想想罢
不是TXT格式的
楼主怎么整理啊

怎么弄不用问我,我说的只是2楼可能的意思
11
发表于 2010-1-14 07:44:06 | 只看该作者
原帖由 还是支持紫光 于 2010-1-13 22:04 发表

怎么弄不用问我,我说的只是2楼可能的意思



我的2楼就是这个意思,楼主的意思肯定也是直接导入其它输入法的词库而不是通过txt中转一下。
12
发表于 2010-1-14 07:47:57 | 只看该作者
原帖由 sunmd 于 2010-1-13 13:55 发表
搜狗词库、qq词库是txt文件么?
如果是,则使用ultraedit-32(排序、去重、通过正则替换去掉拼音等),再使用紫光的“批量造词”辅助工具导入成紫光的词库。

使用熟练,则做这些工作应该在10分钟内搞定。不应该特 ...




好像QQ拼音和搜狗拼音都是只能导出用户词库为txt,自带词库是不可以的。自带词库也不是txt格式。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-26 07:39

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表