华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 48195|回复: 40
打印 上一主题 下一主题

Unicode_GB18030编码对应表(更新5)

[复制链接]
跳转到指定楼层
1
发表于 2014-2-5 22:18:12 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 wangyanhan 于 2014-3-17 12:26 编辑


Unicode_GB18030编码对应表(更新5)


这是断断续续花了半年多时间收集整理出来的《Unicode/GB18030编码对应表》,自以为是最全的,权当春节礼物放出来共享呵呵!

制作本表的起因是——一直只能在网上搜集到扩展B区以内的Unicode编码资料,因此就产生了自己动手补齐的念头。

当CJK的Unicode编码搜集整理完工后,发现GB18030编码的缺口更大。据原官方资料介绍:GB18030-2000含常用非汉字符号和27533个汉字(包括部首、部件等)的编码;GB18030-2005在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码。但俺在实际中发现,当前已知的GB18030编码远远不止这些……

(一)本码表介绍:
1、参照“Unicode 6.3.0”和“GB18030”最新编码制作,Unicode使用的是16进制统一码。
2、涵盖CJK全部汉字和构形部件,未收录标点符号、特殊符号、非汉字符号和少数民族文字。合计76131字。
3、按Unicode编码排序。

(二)目录:
1、中日韩扩展部首(116字)
2、康熙字典部首(214字)
3、表意文字描述字符(12字)
4、中日韩笔画(36字)
5、中日韩统一表意文字扩展A区(6530字)
6、中日韩统一表意文字(20940字)
7、Unicode私用区部件及汉字(659字)
8、中日韩统一表意文字扩展B区(42711字)
9、中日韩统一表意文字扩展C区(4149字)
10、中日韩统一表意文字扩展D区(222字)
11、中日韩统一表意文字增补集(542字)

(三)示例:







(四)附件下载:

◆Unicode_GB18030编码对应表_更新5.rar (772.18 KB, 下载次数: 9028)

空附件,意在保存下载数呵呵!.zip (162 Bytes, 下载次数: 2289)

“更新5” 详细说明在下面。

Unicode_GB18030编码对应表(更新1)

(一)更新内容:
━━━━
更新列表
━━━━
1、2014.2.6    完成第一稿。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。     
━━━
目  录
━━━
◆1、中日韩扩展部首(116字)
◆2、康熙字典部首(214字)
◆3、表意文字描述字符(12字)
◆4、中日韩笔画(36字)
◆5、中日韩统一表意文字扩展A区(6530字)
◆6、中日韩统一表意文字(20940字)
◆7、Unicode私用区部件及汉字(659字)
◆8、中日韩统一表意文字扩展B区(42711字)
◆9、中日韩统一表意文字扩展C区(4149字)
◆10、中日韩统一表意文字扩展D区(222字)
◆11、中日韩统一表意文字增补集(542字)
◆12、增补私用A区(73字)

(二)12、增补私用A区(73字)预览图:


(四)推荐使用“BabelPad 统一码文字编辑器”浏览:
    本《Unicode_GB18030编码对应表》,内含Unicode超大字符集字符多,因此用普通txt文本编辑器打开时,就会感到速度较慢。有很多汉化的txt文本编辑器,和CJK全集字符的兼容性也不太好。   
    推荐使用“BabelPad 统一码文字编辑器”浏览这一《Unicode_GB18030编码对应表》。“BabelPad 统一码文字编辑器”的主要优点如下:
    1、能以秒级速度打开100M以上的txt文件。和CJK全集字符的兼容性良好。
    2、把光标放在某一字符的前面,在状态栏可显示该字符的内码、字符名称及它的汉语拼音。
    3、软件内置有“字符映射表”、部首拼音检索、众多的转换功能。
    4、附件下载:
百度云网盘_sanwsw分享:
http://pan.baidu.com/s/19oOAQ
BabelPad6.3.0.0.rar
文件大小:1.99M(单文件版)
分享时间:2013-10-13 16:28

Unicode_GB18030编码对应表(更新2)
━━━━
更新列表
━━━━
1、2014.2.6    完成第一稿。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。     
3、2014.2.22   增Unicode编码区块英文名。

更新2预览图:


附件下载:仍然在原下载链接。

Unicode_GB18030编码对应表(更新3修改)

━━━━
更新列表
━━━━

1、2014.2.6    完成第一稿,合计76131字。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。
3、2014.2.22   增Unicode编码区块英文名。
4、2014.2.26   增“7、Unicode私用区部件及汉字”80字,合计76284字。

说明:
昨天放出的 “(更新3)” 稿,在GB18030编码后,还新增了第 “ ❸ ” 项,对37996个汉字加注了汉语拼音。因制作匆忙,错误不少,故今天又放出了 “(更新3修改)” 稿,删除了第 “ ❸ ” 项新增的汉语拼音。特此说明。

更新3预览图——部分新增的私用区汉字:



附件下载:仍然在原下载链接。↑↑↑↑↑

Unicode_GB18030编码对应表(更新4)

说明:

1、参照“Unicode 6.3.0”和“GB18030”最新编码制作,Unicode使用的是16进制统一码。
2、涵盖CJK全部汉字和构形部件,未收录标点符号、特殊符号、非汉字符号、和少数民族文字。合计76914字。
3、私用区汉字的汉语拼音源于“字海网、叶典网”,并用《汉语大字典》的汉语拼音校核。
4、“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区多为兼容变体汉字,这些汉字的汉语拼音,是依照本体汉字语音信息加注的。
5、正文按Unicode编码排序。
6、用文本编辑器查找字头时,在字头后加一个半角空格,可提高查找准确性。

━━━━
更新列表
━━━━

1、2014.2.6    完成第一稿,合计76131字。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。
3、2014.2.22   增Unicode编码区块英文名。
4、2014.2.27   增“7、Unicode私用区部件及汉字”80字,合计76282字。
5、2014.3.5    ①增“7、Unicode私用区部件及汉字”159字、“8、中日韩兼容表意文字”汉字473个,合计76914字。②增“Unicode 6.3.0”数据库语音信息(汉语拼音)37956字,增私用区汉字汉语拼音236字,增中日韩兼容表意文字汉语拼音454字,增“12、中日韩统一表意文字增补集”汉语拼音475字。合计汉语拼音39121字。③在目录和区块标题中增加了“区块码段”信息。

更新4新增内容预览图:



附件下载:
仍然在原下载链接。↑↑↑↑↑

Unicode_GB18030编码对应表(更新5)

说明:

1、参照“Unicode 6.3.0”和“GB18030”最新编码制作,Unicode使用分别10、16进制两种统一码。
2、涵盖CJK全部汉字和构形部件,未收录标点符号、特殊符号、非汉字符号、和少数民族文字。合计76965字。
3、汉语拼音大部分源于“Unicode 6.3.0”数据库语音信息。私用区类推简化字的汉语拼音源于“字海网、叶典网”,并参照《汉语大字典》中的繁体字校核。“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区多为兼容变体字,这些字的汉语拼音,是依照本体汉字语音加注的。
4、正文按Unicode编码排序。10、16进制统一码使用都很普遍,且10进制码和网页码数字相同,因此将二者皆录入。
5、私用区有一部分部件和汉字,需在超大字符集支持包“Unifonts 6.0”下,安装2013版“SunmanPUA”字体后才能显示。
6、用文本编辑器查找字头时,在字头后加一个半角空格,可提高查找准确性。

━━━━
更新列表
━━━━

1、2014.2.6    完成第一稿,合计76131字。
2、2014.2.21   增“增补私用A区(73字)”,合计76204字。
3、2014.2.22   增Unicode编码区块英文名。
4、2014.2.27   增“私用区部件及汉字”80字,合计76282字。
5、2014.3.5    ①增“私用区部件及汉字”159字、“8、中日韩兼容表意文字”汉字473个,合计76914字。②增“Unicode 6.3.0”数据库语音信息(汉语拼音)37956字,增私用区汉字汉语拼音236字,增中日韩兼容表意文字汉语拼音454字,增“12、中日韩统一表意文字增补集”汉语拼音475字。合计汉语拼音39121字。③在目录和区块标题中增加了“区块码段”信息。
6、2014.3.16   ①增“表意文字增扩展A区”52字,合计76965字。②增“表意文字增扩展A区”汉语拼音52字,“〇”拼音一字,合计汉语拼音39174字。③修改错误16进制\u码一处。④增Unicode 10进制统一码。

“更新5”预览图:



附件下载:
仍然在最上面下载。↑↑↑↑↑
2
 楼主| 发表于 2014-2-6 12:37:04 | 只看该作者
谢谢野风管理员节假日光顾本帖,为本帖贴金助威呵呵!
3
发表于 2014-2-6 13:41:51 | 只看该作者
呵呵!不好意思,忘记顶帖了!
4
发表于 2014-2-6 15:00:27 | 只看该作者
是啊,收藏了,忘记顶贴了,补上

点评

谢谢L版捧场呵呵!^_^  发表于 2014-2-6 15:27
5
发表于 2014-2-9 10:20:31 | 只看该作者
6
发表于 2014-2-9 10:41:39 | 只看该作者
老王兄的新头像很漂亮!o(∩_∩)o

点评

要不要给您也觅一款下雪的头像啊?  发表于 2014-2-9 14:18
陈兄管座:俺这里下了几天小雪,就换上了这个头像呵呵!前几天听女儿说无锡的气温也降了,上海下雪没?  发表于 2014-2-9 14:16
7
发表于 2014-2-9 12:08:41 | 只看该作者
老王,我认为这是本版最好的帖子,
并首次运用置顶权利,
给您置顶
8
发表于 2014-2-9 14:21:49 | 只看该作者
上海中午开始下雪的。还下得不小,因为是白天,积不起来。不过现在已经不下了。
9
 楼主| 发表于 2014-2-9 14:35:57 | 只看该作者
本帖最后由 wangyanhan 于 2014-2-9 15:53 编辑
紫光蓝天 发表于 2014-2-9 12:08
老王,我认为这是本版最好的帖子,
并首次运用置顶权利,
给您置顶
热烈祝贺蓝天版主在所辖板块内首次行使置顶职权!

对卑帖能享此殊荣深表衷心的感谢呵呵!
10
发表于 2014-2-9 14:44:37 | 只看该作者
你们那里下雪,我这里下雨

点评

呵呵!  发表于 2014-2-9 15:08
11
 楼主| 发表于 2014-2-9 15:47:01 | 只看该作者
野风 发表于 2014-2-9 14:21
上海中午开始下雪的。还下得不小,因为是白天,积不起来。不过现在已经不下了。

陈兄管座:
在网上找了一下,没有比俺那个原头像更好的雪景了。因为那款动画图片是用拍摄出来的图片叠加制作的,所以很逼真!
俺把自己的头像换了,把那个原头像送给您呵呵!



冬雪gif.zip (56.84 KB, 下载次数: 1674)

点评

老王兄,你也没有必要把自己的头像换了啊!  发表于 2014-2-9 16:18
谢老王兄了!o(∩_∩)o  发表于 2014-2-9 16:17
12
 楼主| 发表于 2014-2-9 15:50:00 | 只看该作者
紫光蓝天 发表于 2014-2-9 14:44
你们那里下雪,我这里下雨

蓝天版主:从宏观说,这就是 “雪雨交加” 呵呵!
13
 楼主| 发表于 2014-2-9 16:31:20 | 只看该作者
@野风

野风  老王兄,你也没有必要把自己的头像换了啊!  发表于 8 分钟前

野风  谢老王兄了!o(∩_∩)o  发表于 8 分钟前

回复:俺自己不用那个头像没关系的。和论坛官员的头像雷同了不太好,似乎有点 “犯上” 呵呵!

点评

我不能“抢夺”啊!呵呵。  发表于 2014-2-9 17:44
14
 楼主| 发表于 2014-2-9 18:31:41 | 只看该作者
@野风

回复:我不能“抢夺”啊!呵呵。  发表于 半小时前

看陈兄管座说到哪里去了,俺送的,不存在 “抢夺” 之说啊呵呵!
15
发表于 2014-2-10 08:32:23 | 只看该作者
何为CJK?
原来CJK 乃是
中文(Chinese)
日文(Japanese)
韩文(Korean)
三国文字的缩写

点评

极是呵呵!  发表于 2014-2-10 13:10
16
发表于 2014-2-10 08:39:29 | 只看该作者
不错,相当有价值。
帮顶了。
楼主是干什么工作的?怎么又闲情趣志收集这些东西?

点评

回bbc0556兄:俺现在的岗位——年近古稀之退休老人呵呵!  发表于 2014-2-10 13:14
17
 楼主| 发表于 2014-2-10 13:45:59 | 只看该作者
本帖最后由 wangyanhan 于 2014-2-10 13:54 编辑
紫光蓝天 发表于 2014-2-10 08:32
何为CJK?
原来CJK 乃是
中文(Chinese)
蓝天版主所言极是呵呵!

下面是一款没有汉化编码区名称的字符映射表截图。红框中显示的,是4个紧紧相连区块—— “ 扩展B区、扩展C区、扩展D区、增补集” 的条目。



在很多资料中,也使用这种表达式—— “ Ext-A、Ext-B、Ext-C、Ext-D ” 。
18
发表于 2014-2-11 15:55:16 | 只看该作者
呵呵,楼主年纪这么大了啊~~
应该是对中国的文字艺术颇有一番研究的。
我只是一个20多岁的软件开发人员。
19
 楼主| 发表于 2014-2-11 17:02:49 | 只看该作者
本帖最后由 wangyanhan 于 2014-2-11 17:11 编辑
bbc0556 发表于 2014-2-11 15:55
呵呵,楼主年纪这么大了啊~~
应该是对中国的文字艺术颇有一番研究的。
我只是一个20多岁的软件开发人员。
谈不上对文字有研究,两年多以前进加加论坛后,学到了一些文本处理和码表制作技巧。

加加是个老牌拼音输入法,曾有一段辉煌的历史,因此在论坛中有很多大师级作品,如果用心研究就会受益匪淺呵呵!

俺女婿也是摆弄软件的,2001年的计算机专业,现在都快40岁了,不过在六七年前就转搞了管理。


20
发表于 2014-2-12 10:45:19 | 只看该作者
wangyanhan 发表于 2014-2-11 17:02
谈不上对文字有研究,两年多以前进加加论坛后,学到了一些文本处理和码表制作技巧。

加加是个老牌拼音输 ...

呵呵,都是元老级别的啊~~
21
 楼主| 发表于 2014-2-12 16:34:05 | 只看该作者
bbc0556 发表于 2014-2-12 10:45
呵呵,都是元老级别的啊~~

“元老” 级别——这都是一类务虚的东西啊呵呵!你看,俺的坛龄比你小,无非是在这一年多的时间里 ,发的帖子、图片、附件多呵呵!
22
 楼主| 发表于 2014-2-21 18:41:07 | 只看该作者
这个 “丰” 字不出头的 “ 帮 ” 字头的汉字部件,以前一直没找着,原来在这里躲藏着呵呵!

23
 楼主| 发表于 2014-2-22 01:24:01 | 只看该作者
《Unicode_GB18030编码对应表》再次更新

━━━━
更新列表
━━━━
1、2014.2.6    完成第一稿。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。     
3、2014.2.22   增Unicode编码区块英文名。

更新2预览图:


人工顶一下。附件下载仍在一楼   
↑↑↑↑↑
24
发表于 2014-2-26 13:09:58 | 只看该作者
看了一下老王的注音
发现有的字依然有注音的可能

雑 ❶96D1 ❷EB6A

这个字康熙字典说
是杂的通俗写法
更为重要的是
日语的杂就写成雑
我的帖子“日本汉字短语”
就有这个字

老王可参考我发的两个帖子
为更多的汉字标上注音

日本汉字短语(蓝天双拼·紫光双拼·全拼)
http://bbs.unispim.com/forum.php?mod=viewthread&tid=29379

港台汉字短语(蓝天双拼·紫光双拼·全拼)
http://bbs.unispim.com/forum.php?mod=viewthread&tid=29390
25
 楼主| 发表于 2014-2-26 13:32:53 | 只看该作者
紫光蓝天 发表于 2014-2-26 13:09
看了一下老王的注音
发现有的字依然有注音的可能

蓝天版主可以的,您提供的资料,俺立即下载收藏!

这个《Unicode/GB18030编码对应表》里的汉语拼音,是完全照搬 “Unicode 6.3.0” 版语音信息弄出来的,还没俺原先制作的“【Unicode CJK 拼音表_增补】” 多(41138个),《Unicode CJK 拼音表》用的是 “Unihan Database Lookup” 数据库中的语音信息。

主要是时间和精力的问题,先慢慢的搜集,然后再慢慢整理吧呵呵!

26
 楼主| 发表于 2014-2-26 13:59:00 | 只看该作者
@紫光蓝天  

譬如说 “ 王 ” 字吧, 在 “Unicode 6.0.0” 版的语音信息里,都有三个拼音:wáng/wàng/yù ,可到 “Unicode 6.3.0.0 ”  版里,却把 yù 音给删除了。在《汉语大字典》里,“王” 也有 yù 的拼音,出处清楚。可“Unicode 6.3.0.0 ”  版就是删了,鬼知道原因何在呵呵!
27
发表于 2014-2-26 14:13:04 | 只看该作者
老王,看来你选用的资料是很规范的,很好
我那两个码表上的字是现今日本、港台仍在使用的
所以也是比较常用的
一会我比较一下
看缺了多少
估计不多
28
发表于 2014-2-26 16:17:43 | 只看该作者
老王:
和 日本汉字短语 对照了一下
gb2312常用汉字内
缺读音汉字298个
在楼下贴出
(其中多音字只标了一个读音)
29
发表于 2014-2-26 16:18:08 | 只看该作者
ba 抜
bai 拝
bang 幇
bian 邉
bian 変
bian 辧
bian 辺
bing 餠
bu 歩
ce 厠
ceng 曽
cha 挿
chai 犲
chan 懴
chang 甞
chao 巣
chen 鎭
cheng 乗
chi 鵄
chi 遅
chi 歯
chuan 伝
cong 聡
cong 従
cu 卆
cuan 攅
cuan 簒
cui 忰
cui 翆
cui 粋
cuo 嵳
da 逹
dai 帯
dan 単
dan 弾
dao 嶋
dao 稲
de 悳
de 徳
di 逓
dian 巓
die 畳
die 疂
die 疉
dong 鶫
dou 闘
dou 鬪
dou 読
du 涜
dui 対
duo 駄
e 悪
e 蕚
er 児
er 尓
er 弐
er 貮
fa 発
fa 髪
fan 飜
fei 廃
fo 仏
fu 釡
fu 冨
gai 葢
gai 漑
gao 皐
geng 羮
geng 頚
guai 枴
guan 観
guan 潅
guang 広
gui 帰
gui 亀
han 凾
hu 壷
huai 懐
huai 壊
huan 歓
huan 渙
hui 恵
hui 絵
ji 喞
ji 撃
ji 韲
ji 鶏
ji 羇
ji 剤
ji 済
ji 継
ji 曁
ji 斉
jia 仮
jia 頬
jian 殱
jian 倹
jian 検
jian 鹸
jian 剣
jian 剱
jian 賎
jian 劒
jiang 醤
jiao 撹
jiao 覚
jie 掲
jie 畍
jin 菫
jin 侭
jing 亰
jing 経
jing 浄
jiong 烱
ju 倶
ju 挙
ju 欅
ju 拠
juan 圏
juan 巻
jue 絶
jun 皹
kuang 昿
kuang 砿
kuang 鉱
kuo 拡
la 蝋
lai 頼
lai 瀬
lan 覧
lao 労
le 楽
lei 塁
lei 涙
li 茘
li 暦
li 歴
li 檪
lian 聨
lian 錬
liang 両
liang 輌
lie 猟
ling 霊
ling 齢
liu 畄
liu 璢
liu 澑
long 篭
long 滝
mai 売
man 満
mao 貎
me 麼
meng 萠
mian 麺
mo 黙
mu 嘸
mu 畆
nang 嚢
nao 悩
nao 脳
nao 閙
niang 嬢
niang 醸
nie 噛
ning 侫
ou 鴎
po 醗
po 溌
pu 舗
qi 気
qian 銭
qian 濳
qian 籖
qiu 逎
qu 駆
qu 駈
quan 権
quan 勧
rang 穣
rang 壌
rang 譲
ren 仭
rong 栄
run 閠
sao 掻
sao 騒
sao 鯵
se 渋
shao 焼
she 舎
she 渉
she 摂
shen 愼
sheng 縄
sheng 剰
shi 実
shi 丗
shi 亊
shi 釈
shou 痩
shou 獣
sou 捜
su 粛
sui 髄
sui 砕
sui 穂
suo 簔
teng 籘
tie 鐡
ting 聴
ting 廰
tou 偸
tu 図
tuan 団
tun 呑
tuo 楕
wa 膃
wan 晩
wang 徃
wen 穏
wu 呉
xi 渓
xi 煕
xi 犠
xian 繊
xian 纎
xian 険
xian 顕
xian 県
xian 陥
xiang 郷
xiao 暁
xiu 繍
xu 続
xu 聟
xun 勲
xun 薫
ya 圧
ya 唖
ya 亜
yan 塩
yan 厳
yan 巌
yan 焔
yan 鳫
yan 験
yan 艶
yang 様
yao 尭
yao 揺
yao 薬
ye 曵
yi 壱
yi 訳
yi 駅
yin 隠
yin 飮
ying 応
ying 桜
ying 鴬
ying 蛍
ying 営
ying 蝿
yu 娯
yu 楡
yu 喩
yuan 渕
yuan 縁
za 雑
zan 讃
zang 賍
zang 弉
zang 臓
zao 竃
ze 択
ze 沢
zen 譛
zeng 増
zhai 斎
zhan 桟
zhan 戦
zheng 徴
zhi 値
zhu 鋳
zhuan 専
zhuan 転
zhuang 荘
zhun 凖
zi 姉
zong 惣
zong 縦
zou 赱
zu 爼
zuan 鑚
zuan 纉
zui 酔
30
发表于 2014-2-26 16:33:21 | 只看该作者
老王,你的女儿、女婿都在日本生活过
相信他们看了这些字
都会觉得十分常用
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-23 20:32

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表