华宇拼音输入法论坛

标题: 选择“简体”还是选择“全集”? [打印本页]

作者: sanwsw    时间: 2011-8-10 17:42
标题: 选择“简体”还是选择“全集”?
选择“简体”还是选择“全集”?

  紫光华宇拼音输入法“设置”中“输出集合”有“简体”、“繁体”、“全集”之分,紫光用户有必要了解这里的“简体”、“繁体”、“全集”含义。
  一般用户对于简体字、繁体字是有感性认识的,但要说清简体字、繁体字的准确概念恐怕有点难度。学术界、网络上对简体字、繁体字讨论、争辩非常激烈,可以说“简体字”是个较为复杂的概念。
  繁杂问题简单化。大家既不是语言学家、文字学家,也不想参与简繁之争,那只需了解“简体”、“繁体”、“全集”的大概意思就可以了。
  我的理解,“简体字”或“简体”有两层意思,第一层意思指中国大陆目前通用的汉字系统,是个集合,包含非简非繁的历史传承字在内,它相对于繁体字系统(或传统汉字系统、正体字系统);第二层意思是指20世纪五六十年代汉字简化运动中新造、历史上本无该字(字形)的那些具体汉字。
  搜索网络得知,1986年重发的《简化字总表》中,482个纯简化字+类推简化字1753个=2235个简化字,它相对的繁体字字数理论上也是2235个(实际上不只2235个,一简对多繁关系)。如考虑482个“纯简化字”中部分字借用其他汉字字形(如“台-臺”这组的“台”、“丑-醜”这组的“丑”,假定这部分数量为 ),那么上面第二层意思的“简化字”数量少于2235个。
  从上面的理解出发,紫光拼音的“简体”、“繁体”、“全集”可这样理解:
  “简体”≈“全集”-2235个繁体字【带有没剔除的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字】
  “繁体”≈“全集”-(《简化字总表》中的2235个-
  “全集”=CJK及其扩展集全部汉字【75000多个】
  由于紫光拼音字库从原来的GBK字符集21003个汉字一下子扩大到75000多个汉字,在选择“国际超大字符集”情况下,开发组没有精力也没有能力将2235个简化字和之外汉字的对应异体字全部挑出来,因此紫光拼音输入法V6.7.1.36版本内的“简体”必然掺杂了为数不少的异体字。就像有洁癖的人容不得家里有半点垃圾一样,很多紫光用户觉得紫光华宇拼音输入法“简体”内存在“鉴、鋻”并收这类现象很不舒服,这可以理解。好在紫光拼音“简体”集合中的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字的字频都极低,一般不影响汉字输入的流畅性。我总是选择“全集”,汉字输入中并无不便,因为目前的字频总体上还算合理。希望更新版能对多音字不同读音下的字频进行优化。
  如已基本了解了上面的意思,选择“简体”还是选择“全集”应该不是个问题。
作者: 紫光蓝天    时间: 2011-9-2 21:12
最好能有个gb2312的6763个简体字的选项
我用这些字一般也够用了
里面没有的字,比如 镕,都是可以打词组的。
作者: renkai@yahoo.cn    时间: 2011-9-8 15:02
解释的很全面
作者: sanwsw    时间: 2011-9-24 12:39
原帖由 紫光蓝天 于 2011-9-2 21:12 发表
最好能有个gb2312的6763个简体字的选项
我用这些字一般也够用了
里面没有的字,比如 镕,都是可以打词组的。

我曾经对此提议持赞同、附和态度。
你可这样选择:

这个组合,应该约等于GB2312字符集。
作者: 紫光蓝天    时间: 2011-9-24 12:53
是的。很久以前的紫光版本有GB2312字符集。这个字符集各大输入法现在大都不用了,直接选简体就可以了
作者: sanwsw    时间: 2011-9-24 17:10
不大对。GB2312字符集仍是各大输入法的首选啊。
作者: goldyds    时间: 2011-11-3 00:48
GB2312字符集仍是各大输入法的首选
作者: 野风    时间: 2011-11-8 22:37
建议用gbk+全集。
作者: sanwsw    时间: 2011-11-9 10:38
猜测:
GBK+简体≈GB2312所收汉字
GBK+繁体≈BIG-5所收汉字
GBK+全集=GBK字符集所收汉字

作者: 野风    时间: 2011-11-9 16:03
紫光拼音不能输出大5码(big5)的!
繁体字不等于big5字……
作者: sanwsw    时间: 2011-11-9 18:45





欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2