华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 21539|回复: 5
打印 上一主题 下一主题

[BUG]批量造词工具生成检查拼音多音字注音问题

[复制链接]
跳转到指定楼层
1
发表于 2013-3-18 10:31:18 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式
在使用这个工具时,系统没能检测到以下多音字:





6
发表于 2013-5-15 12:08:41 | 只看该作者
本帖最后由 wangyanhan 于 2013-5-15 12:47 编辑

现在网上见到的汉字注音工具不少,但对多音字的辨析,还没有发现哪一款注音软件过关。

相比之下,华宇6.0版的“批量造词”、“深蓝词库转换2.0”、加加的“黄伟词库处理”和“实用汉字转拼音”,为稍微好一点的注音软件。

华宇6.0版的“批量造词”工具,是靠内置的“hzpy.dat”文件来辨析多义字的。“深蓝词库转换2.0”和加加的“黄伟词库处理”,是凭借外置的注音库来来辨析多义字的。“实用汉字转拼音”则是内置的分词库。

我个人觉得华宇6.0版的“批量造词”倒是最好的注音工具,它最大的优点就是能把有歧义的多音词条显示出来,并且不将有歧义的词条导入词库。但是这样一来,就给操作者带来了繁重的手工修改任务。该工具若能进行改进,在“hzpy.dat”的基础上再添加一个外置的注音库,随着外置注音库多义字词条的积累,它的多音词辨析能力就会越积累越强大,就会逐步减轻手工修改的强度了。

最后再把话说回来,汉字注音工具对多音字的辨析,是程序设计工作者的一个高难度课题。注音软件即使有强大的注音库辅助,但靠它固定模式的算法,也难以应付千变万化的词组和短语结构。因此也不能强求达到100%的准确水平,能达到小于千分之一的不识别率就是很不错的指标了呵呵。



5
发表于 2013-3-20 07:27:59 | 只看该作者
这个工具确实是有一些多音字不能识别出来。
头像被屏蔽
4
发表于 2013-3-18 15:45:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
3
 楼主| 发表于 2013-3-18 13:46:38 | 只看该作者




2
发表于 2013-3-18 11:27:15 | 只看该作者
官方对周边小软件的优化貌似没什么兴趣
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 00:05

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表