|
|
本帖最后由 wangyanhan 于 2014-8-10 11:53 编辑
【CJK 汉字拼音表——42907字】
(2014.8.10更新)
wangyanhan(老老朽)整理制作
━━━━
目 录
━━━━
说明
“Unihan Database Lookup 7.0.0”汉字拼音表(41219字)
“Unicode 7.0.0”中仅有的汉字拼音表(499字)
私用区汉字拼音表(254字)
中日韩兼容表意文字区汉字拼音表(450字)
中日韩统一表意文字增补集区汉字拼音表(475字)
其它资料上收集的汉字拼音表(10字)
—————————————————
◆说明:
(一)“Unihan Database Lookup 7.0.0”数据库汉字拼音表:
1、依据“Unihan Database Lookup 7.0.0”数据库中的语音信息制作。
(数据库主页:http://www.unicode.org/charts/unihan.html)
2、拼音源于《汉语大字典》和《现代汉语词典》中的汉语拼音。
3、计41219个汉字拼音,范围为“Ext-基本、Ext-A、Ext-B、Ext-C、Ext-D”区的汉字。
(二)“Unicode 7.0.0”中仅有的汉字拼音表:
1、是“Unihan Database Lookup 7.0.0”数据库中没有,而“Unicode 7.0.0”数据库中仅有的汉字拼音。
2、数据从英国语言学家魏安(Andrew West)先生著名的字符软件“BabelMap 7.0.0”中提取。计499字。
(三)私用区汉字拼音表:
1、范围为[E600-E6F7]、[E815-E864]。
2、拼音资料最初源于“字海网、叶典网”(http://yedict.com/)。后又参照《汉语大字典》,用繁体字对类推简化字的拼音进行了校正。计254字。
(四)兼容表意文字区和增补集区中的汉字拼音表:
1、“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区多为兼容变体汉字,这些汉字的拼音,都是依照本体汉字语音加注的。
2、合计925字。其中兼容表意文字450字;增补集475字。
(五)其它资料上收集的汉字拼音表:
1、是在其它资料上另外收集到的有音汉字。其中“〇”音的资料来源为“《现代汉语词典》(第五版)”,“𠀤”音的资料来源为“《汉语大字典》(第二版)”。计10字。
2、这部分有些汉字的拼音仅供参考。
(六)由规范声调拼音和数字声调拼音两种形式加注。数字声调的优点是便于检索。
(七)用“◆”查找,可在各正文标题之间跳转。
(八)因数据浩瀚,整理中估计错误难免,盼网友们多加指正。
◆更新列表:
——2014.3.12
1、在“Unihan Database Lookup”数据库汉字拼音表中,因多音字优化不彻底,造成有3个重复汉字。现已去重复,将多音合并。
2、经排查,发现“Unicode 6.3.0”数据库中有523字是“Unihan Database Lookup”数据库中没有的,现将其添加进了本表。
3、私用区汉字拼音表原只有178字,后改变BabelMap字符映射表的显示字体,新发现了[E815-E864]码段汉字,增加到236字。
4、新增“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区兼容变体汉字拼音929字。
5、其它资料上收集的汉字拼音表原为69字,后在私用区和兼容变体汉字中找到了,减至35字。
——2014.7.18
1、新增“諶、谌”字的另一语音“shèn”。
2、新增私用区[E6D0-E6F7]码段18字。
3、将多音字拼音的分隔符改成了“/”(原为半角空格)。
——2014.8.10
1、重新整理了“Unihan Database Lookup 7.0.0”版中的汉字拼音。保留了“諶、谌”字的另一语音“shèn”。
2、重新整理了“Unicode 7.0.0”中仅有的汉字拼音。
3、在“中日韩兼容表意文字”区和其它资料上收集的汉字中,减除了“Unihan Database Lookup 7.0”中新增的汉字。
4、参照“Unicode 7.0.0”中计量单位双音字的拼音格式,对其它资料上收集的“瓧、瓰、瓱、、瓼、甅”字拼音进行了修改。
5、在被检索的汉字头,添加了星号引导符“*”。
◆附件下载:
CJK汉字拼音表_42907字_14.8.10更新.rar
(289.92 KB, 下载次数: 2040)
|
|