华宇拼音输入法论坛

标题: [BUG]批量造词工具生成检查拼音多音字注音问题 [打印本页]

作者: krsun    时间: 2013-3-18 10:31
标题: [BUG]批量造词工具生成检查拼音多音字注音问题
在使用这个工具时,系统没能检测到以下多音字:






作者: kingdick    时间: 2013-3-18 11:27
官方对周边小软件的优化貌似没什么兴趣
作者: krsun    时间: 2013-3-18 13:46





作者: Loquat-Honey    时间: 2013-3-18 15:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: 野风    时间: 2013-3-20 07:27
这个工具确实是有一些多音字不能识别出来。
作者: wangyanhan    时间: 2013-5-15 12:08
本帖最后由 wangyanhan 于 2013-5-15 12:47 编辑

现在网上见到的汉字注音工具不少,但对多音字的辨析,还没有发现哪一款注音软件过关。

相比之下,华宇6.0版的“批量造词”、“深蓝词库转换2.0”、加加的“黄伟词库处理”和“实用汉字转拼音”,为稍微好一点的注音软件。

华宇6.0版的“批量造词”工具,是靠内置的“hzpy.dat”文件来辨析多义字的。“深蓝词库转换2.0”和加加的“黄伟词库处理”,是凭借外置的注音库来来辨析多义字的。“实用汉字转拼音”则是内置的分词库。

我个人觉得华宇6.0版的“批量造词”倒是最好的注音工具,它最大的优点就是能把有歧义的多音词条显示出来,并且不将有歧义的词条导入词库。但是这样一来,就给操作者带来了繁重的手工修改任务。该工具若能进行改进,在“hzpy.dat”的基础上再添加一个外置的注音库,随着外置注音库多义字词条的积累,它的多音词辨析能力就会越积累越强大,就会逐步减轻手工修改的强度了。

最后再把话说回来,汉字注音工具对多音字的辨析,是程序设计工作者的一个高难度课题。注音软件即使有强大的注音库辅助,但靠它固定模式的算法,也难以应付千变万化的词组和短语结构。因此也不能强求达到100%的准确水平,能达到小于千分之一的不识别率就是很不错的指标了呵呵。








欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2