|
|
本帖最后由 wangyanhan 于 2013-5-15 12:47 编辑
现在网上见到的汉字注音工具不少,但对多音字的辨析,还没有发现哪一款注音软件过关。
相比之下,华宇6.0版的“批量造词”、“深蓝词库转换2.0”、加加的“黄伟词库处理”和“实用汉字转拼音”,为稍微好一点的注音软件。
华宇6.0版的“批量造词”工具,是靠内置的“hzpy.dat”文件来辨析多义字的。“深蓝词库转换2.0”和加加的“黄伟词库处理”,是凭借外置的注音库来来辨析多义字的。“实用汉字转拼音”则是内置的分词库。
我个人觉得华宇6.0版的“批量造词”倒是最好的注音工具,它最大的优点就是能把有歧义的多音词条显示出来,并且不将有歧义的词条导入词库。但是这样一来,就给操作者带来了繁重的手工修改任务。该工具若能进行改进,在“hzpy.dat”的基础上再添加一个外置的注音库,随着外置注音库多义字词条的积累,它的多音词辨析能力就会越积累越强大,就会逐步减轻手工修改的强度了。
最后再把话说回来,汉字注音工具对多音字的辨析,是程序设计工作者的一个高难度课题。注音软件即使有强大的注音库辅助,但靠它固定模式的算法,也难以应付千变万化的词组和短语结构。因此也不能强求达到100%的准确水平,能达到小于千分之一的不识别率就是很不错的指标了呵呵。
|
|