华宇拼音输入法论坛

标题: 【程序试用】文本词库整理工具 [打印本页]

作者: krsun    时间: 2012-10-10 04:03
标题: 【程序试用】文本词库整理工具
本帖最后由 krsun 于 2012-10-18 01:44 编辑

使用方法:
0.先将zip文件解压到任意文件夹中。
1.将待整理的词库拷贝至temp.txt。
2.运行词库整理程序,程序会把待整理词库加载到左边列表中。
3.按Move按钮,可以将左边列表中的当前词移动到右边列表中。
4.按Delete按钮或者按字母d键,删除左边列表中的当前词条。
5.按Edit按钮,可以编辑左边列表中的当前词条。
6.按New按钮,可以在左边列表中添加新的词条。
7.按Clear按钮,可以将左边列表中的所有词条删除。
8.退出程序后,organizeLib.txt中存放着右边列表整理好的词。
9.这只是个初步完成的程序,以后会持续更新。
10.希望试用人,提出意见和建议。

2012-10-13 00:58 更新
1.增加支持加载大词库功能
词库以分段加载显示的方式解决加载超大词库时产生的延迟问题。

2012-10-15 19:15 更新
1.支持多个词条批量移动,使操作更便捷
选择多个词条的方法是:
Ctrl+鼠标左键(增加一个)
Shift+鼠标左键(增加多个)
鼠标选中一个然后向上下拖动鼠标,也可以实现选中多个。
2.提供应用程序图标
3.可以试试将窗口最大化,这样可以显示更多的词条。

2012-10-18 01:19 更新
1.完善词库文件操作
用户启动程序时,系统自动将pendingLib.txt词库备份为pendingLib.bak文件。
用户退出程序时,系统会将用户删除和移动的词条从pendingLib.txt中剔除。
用户删除的词条会追加记录在deletedLib.txt中。
用户本次操作整理的词条会追加记录在organizeLib.txt中。
2.重构程序使逻辑结构更合理。

WordsOrganize.zip (3.25 MB, 下载次数: 1307)
WordsOrganize.zip (111.53 KB, 下载次数: 1513)

备注:
第一个附件包含程序用到的DLL库,比较大一些。
第二个附件只包含程序文件以及更新说明和示例词库文件,如果已经下载解压过第一个附件,可以仅下载第二个附件,这样比较节省时间。
下载后直接解压覆盖原来的文件即可。
作者: 觉贤    时间: 2012-10-10 22:10
好东东,希望继续更新呵呵
作者: 古陶瓦    时间: 2012-10-12 08:45
建议增加批量操作,这样只是一条一条地删除增减,比较慢,如果能批量的话就好了。
作者: 野风    时间: 2012-10-12 09:10
支持一下!
作者: 紫光蓝天    时间: 2012-10-12 09:34
支持一下
作者: sanwsw    时间: 2012-10-12 15:17
希能根据紫光拼音txt词库格式,升级成一个综合性的词库整理工具。老左提供的DOS系列工具毕竟使用起来不方便。






作者: wangyanhan    时间: 2012-10-12 15:53
本帖最后由 wangyanhan 于 2012-10-12 16:01 编辑
sanwsw 发表于 2012-10-12 15:17
希能根据紫光拼音txt词库格式,升级成一个综合性的词库整理工具。老左提供的DOS系列工具毕竟使用起来不方便 ...

在戴老师图示的张文焕加加词库工具整合集中,其中“词库整理Ver1.05”是可以用于紫光的,我使用快半年(用于加加的时间更长)了,无丝毫问题。

张文焕的工具还有一个优点:不需要“dotnetfxchs”支持,在通常操作系统环境便可运行。


作者: sanwsw    时间: 2012-10-12 18:03
V1.05版有了?可否寄给我一份?
作者: wangyanhan    时间: 2012-10-12 23:29
sanwsw 发表于 2012-10-12 18:03
V1.05版有了?可否寄给我一份?
戴老师好的!

拼音加加词库整理 Ver1.05.rar (11.33 KB, 下载次数: 1273)
作者: krsun    时间: 2012-10-13 01:20
本帖最后由 krsun 于 2012-10-13 17:15 编辑

程序更新了,但是无法上传附件。给个下载连接。
----------------------------------------------------------------
现在附件可以上传了,可能系统刚刚升级,还没有捋顺。^_^

作者: krsun    时间: 2012-10-13 01:23
古陶瓦 发表于 2012-10-12 08:45
建议增加批量操作,这样只是一条一条地删除增减,比较慢,如果能批量的话就好了。

谢谢古大师捧场
以后会逐渐增加功能
现在这个软件主要是想给用户方便整理用户词库中积累的词条。
希望以后能越做越好。
作者: krsun    时间: 2012-10-13 01:26
谢谢老王捧场
以后会借鉴加加词库整理工具
作者: krsun    时间: 2012-10-13 01:28
sanwsw 发表于 2012-10-12 15:17
希能根据紫光拼音txt词库格式,升级成一个综合性的词库整理工具。老左提供的DOS系列工具毕竟使用起来不方便 ...

sanwsw有什么建议提出来,我尽量满足。^_^
作者: krsun    时间: 2012-10-15 19:34
程序更新支持批量操作欢迎使用
作者: wangyanhan    时间: 2012-10-15 20:34
krsun版主果然不同凡响,短短五日,就变成能支持批量操作了!^_^
作者: krsun    时间: 2012-10-18 01:45
程序更新
欢迎使用
^_^
作者: krsun    时间: 2012-10-18 21:25
竟然上窜到51次下载
用了的兄弟也给点儿建议呗
作者: sanwsw    时间: 2012-10-22 12:48
wangyanhan 发表于 2012-10-12 23:29
戴老师好的!

谢谢了。我看错,以为集成版升级了。^_^^_^

对于紫光文本词库,凡词条相同、拼音相同,词频不同的,也可按一定规则进行并集、交集、差集、删除的运算。总之,仿照张文焕先生的工具,使之更适合、更方便紫光文本词库的处理。

再如,sort.exe这个排序工具(开发组提供的DOS命令处理工具),不能设置多项排序因子,你的工具能否设定多项排序因子(比如第一,按第二列拼音之升序;第二,按第三列词频的降序)?
作者: 好休闲    时间: 2012-10-22 13:15
做个记号,慢慢学习。
作者: ljdqe    时间: 2012-10-22 19:53
sanwsw 发表于 2012-10-22 12:48
谢谢了。我看错,以为集成版升级了。^_^^_^

对于紫光文本词库,凡词条相同、拼音相同,词频不同的,也 ...

戴老师这个回复忘记给楼主了,帮你@他  o(∩_∩)o

@krsun  
作者: ljdqe    时间: 2012-10-23 12:52
本帖最后由 ljdqe 于 2012-10-23 13:00 编辑
ljdqe 发表于 2012-10-22 19:53
戴老师这个回复忘记给楼主了,帮你@他  o(∩_∩)o

@krsun


@wangyanhan
在回复上面

未命名1.PNG (16.82 KB, 下载次数: 188)

未命名1.PNG

作者: wangyanhan    时间: 2012-10-23 14:19
ljdqe 发表于 2012-10-23 12:52
@wangyanhan
在回复上面

@ljdqe

呵呵!成功啦!谢谢!谢谢!!!^_^




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2