华宇拼音输入法论坛
标题:
[BUG]批量造词工具生成检查拼音多音字注音问题
[打印本页]
作者:
krsun
时间:
2013-3-18 10:31
标题:
[BUG]批量造词工具生成检查拼音多音字注音问题
在使用这个工具时,系统没能检测到以下多音字:
曾
单
2013-03-18_094958.jpg
(121.77 KB, 下载次数: 89)
下载附件
2013-3-18 10:31 上传
作者:
kingdick
时间:
2013-3-18 11:27
官方对周边小软件的优化貌似没什么兴趣
作者:
krsun
时间:
2013-3-18 13:46
作者:
Loquat-Honey
时间:
2013-3-18 15:45
提示:
作者被禁止或删除 内容自动屏蔽
作者:
野风
时间:
2013-3-20 07:27
这个工具确实是有一些多音字不能识别出来。
作者:
wangyanhan
时间:
2013-5-15 12:08
本帖最后由 wangyanhan 于 2013-5-15 12:47 编辑
现在网上见到的汉字注音工具不少,但对多音字的辨析,还没有发现哪一款注音软件过关。
相比之下,华宇6.0版的“批量造词”、“深蓝词库转换2.0”、加加的“黄伟词库处理”和“实用汉字转拼音”,为稍微好一点的注音软件。
华宇6.0版的“批量造词”工具,是靠内置的“hzpy.dat”文件来辨析多义字的。“深蓝词库转换2.0”和加加的“黄伟词库处理”,是凭借外置的注音库来来辨析多义字的。“实用汉字转拼音”则是内置的分词库。
我个人觉得华宇6.0版的“批量造词”倒是最好的注音工具,它最大的优点就是能把有歧义的多音词条显示出来,并且不将有歧义的词条导入词库。但是这样一来,就给操作者带来了繁重的手工修改任务。该工具若能进行改进,在“hzpy.dat”的基础上再添加一个外置的注音库,随着外置注音库多义字词条的积累,它的多音词辨析能力就会越积累越强大,就会逐步减轻手工修改的强度了。
最后再把话说回来,汉字注音工具对多音字的辨析,是程序设计工作者的一个高难度课题。注音软件即使有强大的注音库辅助,但靠它固定模式的算法,也难以应付千变万化的词组和短语结构。因此也不能强求达到100%的准确水平,能达到小于千分之一的不识别率就是很不错的指标了呵呵。
欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/)
Powered by Discuz! X3.2