华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz

[BUG]批量造词工具生成检查拼音多音字注音问题

查看数: 21536 | 评论数: 5 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2013-3-18 10:31

正文摘要:

在使用这个工具时,系统没能检测到以下多音字: 曾 单

回复

wangyanhan 发表于 2013-5-15 12:08:41
本帖最后由 wangyanhan 于 2013-5-15 12:47 编辑

现在网上见到的汉字注音工具不少,但对多音字的辨析,还没有发现哪一款注音软件过关。

相比之下,华宇6.0版的“批量造词”、“深蓝词库转换2.0”、加加的“黄伟词库处理”和“实用汉字转拼音”,为稍微好一点的注音软件。

华宇6.0版的“批量造词”工具,是靠内置的“hzpy.dat”文件来辨析多义字的。“深蓝词库转换2.0”和加加的“黄伟词库处理”,是凭借外置的注音库来来辨析多义字的。“实用汉字转拼音”则是内置的分词库。

我个人觉得华宇6.0版的“批量造词”倒是最好的注音工具,它最大的优点就是能把有歧义的多音词条显示出来,并且不将有歧义的词条导入词库。但是这样一来,就给操作者带来了繁重的手工修改任务。该工具若能进行改进,在“hzpy.dat”的基础上再添加一个外置的注音库,随着外置注音库多义字词条的积累,它的多音词辨析能力就会越积累越强大,就会逐步减轻手工修改的强度了。

最后再把话说回来,汉字注音工具对多音字的辨析,是程序设计工作者的一个高难度课题。注音软件即使有强大的注音库辅助,但靠它固定模式的算法,也难以应付千变万化的词组和短语结构。因此也不能强求达到100%的准确水平,能达到小于千分之一的不识别率就是很不错的指标了呵呵。



野风 发表于 2013-3-20 07:27:59
这个工具确实是有一些多音字不能识别出来。
Loquat-Honey 发表于 2013-3-18 15:45:54
提示: 作者被禁止或删除 内容自动屏蔽
krsun 发表于 2013-3-18 13:46:38




kingdick 发表于 2013-3-18 11:27:15
官方对周边小软件的优化貌似没什么兴趣

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-24 20:31

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表