332211元老确实是个细心、耐心的人,咱很认同,也稍有区别:
1.简体字的目标是要排除明确的繁体字和异体字,以及字词典中查到的“日本用简体汉字”、“日本用汉字”、“日本和字”、“韩文吏读字”等,典型的简繁还好办一些,最麻烦的异体字的认定,好些字词典中的凡例、解释和文字使用现状冲突,不同的来源也有冲突(A说某字是正体,其它为异体,B说得和A相反或不全相同)。处理这些矛盾的时候,参考了BIG5字符集的收字情况,依据是“BIG5为港台通行交流途径,它不收编的字,其异体的成分更大一些”。
2.繁体字的目标也不是弄成一个大杂烩,而是要考虑“现在通行或活跃”这个原则,一些上面帖子中提到的“古同xx”之类的,也不大想置入这个集合,它们将非简非繁,只有在大字符集中才能输入;“大字符集”这个概念被拓展了,原来是GBK的21003字,现在是CJK的75000多字,目前有拼音的是26000多字,因多音字之故,汉字拼音条目为接近32000。
3.简繁设定的时候,尽可能依据充分,一些眼下未能判定的,处于“亦简亦繁”状态,等待继续审订完成后,争取准确定性。
言不尽意之处,待发布后(仍会有瑕疵,但应该没有太大的问题了)继续沟通。 |