华宇拼音输入法论坛

标题: 大唐注音兼码表生成器v1.5 绿色版公测! [打印本页]

作者: 大唐6688    时间: 2014-6-2 15:16
标题: 大唐注音兼码表生成器v1.5 绿色版公测!
本帖最后由 大唐6688 于 2014-6-2 15:18 编辑

中文信息处理离不开输入法,输入法主流的是拼音,输入法的基础是词库。如何处理汉字注音尤其是多音字注音一直是个老大难,各种词库格式生成与转换是个不大不小的问题。
大唐注音兼码表生成器就是为此而生!
历遍艰辛成大道,吹尽狂沙始到金!
杨意不逢,抚凌云而自惜;钟期既遇,奏流水以何惭?
”路漫漫其修远兮,吾将上下而求索“,端午来临之际,谨以此微软纪念爱国主义辞人屈原!
经过一个多月的琢磨,1.5版正式公测,这一版进步较大,基本就是定型产品了,下一步主要是增加用户自定义功能,满足个性需求。
2014年6月1日,1.5版亮点及更新日志:
1、准——以老王数易其稿、反复校正的现代汉语五版5稿5万多词条的权威词库,进一步校准我的以姚老师39万本身已是很精准的词库提炼而成、包含18万词条的注音库。该注音库非一般的txt文件,采用了特殊的压缩存储格式,内置于程序之中。注音结果与《现代汉语大辞典》比对,基本实现零差异。经老王和姚老师前期内测,效果可喜。
2、精——大幅减少注音库冗余数据,重新设计注音库内部数据存储结构,在大量增加多音词条的情况下,软件体积仍大大减小,大概只有原来的二之一;
3、快——采用了新的查询算法和多音词条及歧义词条处理措施。注音古陶瓦134万纯汉字词库,在我家里老爷笔记本上,用时从1.2版的6分钟减少为200秒!在另一台前年买的相对年轻的台式机上则缩短为137秒!年轻力壮啊
4、爽——充分考虑用户友好性,操作简便易用。增加对已有注音词库进行比对查错的实用功能,既检查第三方词库错误,同时也检验出自身注音库可能仍存在的个别错误并不断修正,使之更趋完美。
5、修正用户反映的取消文件选择不能关闭、以及在800×600分辨率下界面显示不全的bug。
6、点亮简拼生成和词组辅助码功能选项。
7、点亮五笔词库生成功能。

特别鸣谢论坛老王、姚老师的多方帮助!
友情提示:未注册版有处理词条数限制,若需长期使用,请注册。注册不一定需要费用,俺不差钱。

主要功能如下:
1.支持纯汉字码表注音;
2.支持加加格式的自带多音字注音的码表,多音字保留原注音;
3.注音包括全拼注音和双拼注音(默认自然双拼),也支持其它双拼注音,但需要用户自行替换程序附带的全拼双拼对照文件;
4.对双字词可自动增添一位首(尾)字辅助码,默认自然码,也支持其它辅助码方案,但需要用户自行替换程序附带的单字辅助码文件;
5.对三字以上词,可自动生成四码简拼;
6.码表格式可支持加加、搜狗、百度等电脑用或手机用词库格式。
特点:
1.词组辅助码支持;
2.引入了中文分词的思路,一般词库的多音字注音准确率力争95%以上吧;
3.不依赖微软拼音和word的支持,绿色独立,易用性更好;
4.程序吃不准的注音,会在括弧中给出候选读音,手工选定吧。见截图中”参”字,可以判断为“人参”和“参军”两个词,这个后期有望加一条规则判断来解决,呵呵;
5.没有了。毕竟现在的词库工具也很强大了,不求超越,只求自己的刀枪剑戟版再完善一点,算是增加一条霸王鞭吧。呵呵,纯粹有兴趣好玩而已。
目前测试版核心分词注音功能已经基本实现,经试验效果不错。
大唐注音兼码表生成器v1.5公测版.rar (693.13 KB, 下载次数: 1163)
论坛附件容量限制,详情见:http://bbs.jjol.cn/showthread.php?t=16473

搜狗截图20140531234621.png (44.89 KB, 下载次数: 131)

搜狗截图20140531234621.png

作者: zhaoyafei19    时间: 2014-6-3 09:03
不明白
好像没有用过
作者: wangyanhan    时间: 2014-6-4 16:25
本帖最后由 wangyanhan 于 2014-6-4 21:16 编辑


大唐的这个注音器,准确率非常高,大大高于紫光内置的注音器呵呵!

也很容易转换成紫光词库格式——只要把汉字后面的半角逗号 “ , ” 替换成 Tab 空格,就能被紫光拼音输入法导入了呵呵!见下图:



作者: 和你在一起    时间: 2014-6-7 14:04
这位楼主可是拼音加加论坛的前辈啊。向您致敬!软件很实用!顶起!





欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2