华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 13051|回复: 13
打印 上一主题 下一主题

用铅字时代思想规范电脑化了的汉字,必将碰壁——评说《通用规范汉字表》

[复制链接]
跳转到指定楼层
1
发表于 2012-11-11 16:53:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  《通用规范汉字表》(征求意见稿)发布时,网络舆情鼎沸。近日看到一篇文章,批判力度很大,截图分享。









2
 楼主| 发表于 2012-11-11 17:29:15 | 只看该作者
  《汉字文化》杂志2010年第1期“语言文字大论坛”栏目首篇登载了许寿椿教授演讲稿《用铅字时代思想“规范”电脑化了的汉字,必将碰壁——评说<通用规范汉字表>》。
  许先生作为电脑专家,站在信息科学发展的高度,从现阶段计算机中文信息处理已经突破“瓶颈”、已经建立国家标准并成系列的实际出发,指出《通用规范汉字表》的制定者仍然着眼于汉字繁简的规范问题上,是思想停滞在铅字时代“文字改革”思维上的表现;国家语委只认定其前身制定的那些所谓“规范汉字”《字表》等,完全不理睬汉字编码字符集国家标准(GB)规范及其系列,是一种短视行为;批评《字表》专家的某些解说,是由于缺乏汉字电脑化信息处理的基本常识而形成的误解和失当判断。
  许寿椿教授在最后一节“六、落实科学发展观,做好新时期文字工作”中,引用胡锦涛总书记论述“科学判断国内外形势,历来是我们制定正确路线方针政策的前提……要准确认识国际国内的发展环境,准确认识我国发展的阶段性特征”,之后明确指出:“1994年以来,中国汉字信息处理已经告别了铅字时代,成功跨入电脑时代。混淆两个时代,看不到汉字处理已经成功实现电脑化的事实,不适时调整而是继续推行甚至更激进的推行签字时代的政策,是当今文字工作里种种弊端的根源。”
  许先生的演讲别开洞天,向人们展示了一个认识汉字的新境界,促进人们思考——现阶段国家语言文字政策应该如何调整?怎样做才能够适应这一发展过渡时期的特点?
  遗憾的是,一直在网上搜索《汉字文化》上许寿椿等人的演讲稿,至今无果。仅在“百度空间”觅得“布衣三木”的同题博客文章,大概是许寿椿先生在网上的博客署名,姑且把其同名文章的底本(或称“简略稿”)转发出来,以飨网友,先睹为快!当然,还得以杂志文章为准。  

3
 楼主| 发表于 2012-11-11 17:30:06 | 只看该作者
  http://blog.tianya.cn/blogger/po ... 6&Key=905844044

  用铅字时代的思想‘规范’电脑化了的汉字必将碰壁!
  布衣三木
  提要
  本文指出:《规范汉字表》是用铅字时代的思想和方法炮制出的糟糕的方案。它完全不理睬已经实施多年的强制性的汉字编码国家技术标准,根本不具有可行性,也完全没有必要。它一旦阴差阳错地被接受。中国社会良好的信息化、数字化进程将遭受破坏。它还会给中央处理港澳台和华侨事务带来麻烦。

  铅字是汉字的克星,在铅字时代汉字确实是落后了

  漫长的古代,农业时代,汉字是神圣的。其处理加工操作适应于古代(手工操作时代)的社会节奏,和邻近国家和国内其他民族的文字比较,汉字更成熟、更先进。汉字难的问题没有被提出来过。直到西学东渐,列强侵入,特别是铅字排版、印刷,印字电报,机械打字传入后,汉字难的问题才显明提出来。从古登堡发明铅活字印刷到1976年铅字在计算机外部设备中最后被清除,这几百年可以称为是文字处理的铅字时代。历史已经证明:铅字是汉字的克星。在铅字时代汉字与英文相比确实是落后了。确切些说,是汉字的技术属性,即机械化操作属性,落后于英文等拼音文字了。更具体地说,汉字难包括:打字难,打电报难,铅字排版、印刷难以及书写难,排序检索难,读音难,。上述六难是确实的,也是明鲜的。至于汉字难学、难认、难记、难用,则不那么确实,始终存有争议。胡适就认为这些都和教学方法关联密切。汉语拼音曾经减轻了汉字排序难和汉字读音难,对另外的难则无能为力。

  电脑化了的汉字不再落后

  电脑化了的汉字,即实现了电脑处理的汉字,特别是指淘汰了汉字机械打字机,淘汰了汉字四码电报,淘汰了铅字排版、印刷之后的汉字,是指实现了汉字网络化以后的汉字。这可以从1994年算起。因为这之后,由于书写基本为电脑打字取代,书写难变得无足轻重。汉字读音与铅字时期变化不大。纸质介质上汉字资料的排序检索和铅字时代相似;但计算机内汉字词语排序检索已经优于英文。汉字电脑打字、汉字网络传输,汉字激光照排都不再比英文落后。计算机存贮容量的急剧扩大和价格的迅速下降,(2005年普通微机和1980年王选印出样书的微机相比,内存大了16384倍,外存大了2.7万倍,价格降为1/10)。这使得汉字的字量庞大和结构复杂引起的麻烦已经微不足道。在计算机已经实现的信息处理中,声音、图像、活动影像,其存贮量和运算复杂性都比汉字(包括繁体字)要高千倍、万倍。文字信息是多媒体信息中最简单、消耗最少、效率最高的一类。这时还说汉字处理是难题,是拦路虎,实属闭目塞听、脱离实际。

  繁、简体汉字对比发生的变化

  繁、简体汉字的对比发生了什么变化呢?中国上世纪五六十年代的汉字简化,主要是(1)减少笔划;(2)减少字数(同音替代或淘汰异体)。由于汉字四码电报只能编码一万汉字;打字机字盘只能放不足2400铅字,两个字盘不足4800个铅字。因而限制、减少汉字字数在铅字时代是有意义的,是不得已而为之。减少笔画除便于书写外,主要还是铅字铸造中可以减少劳动和降低消耗。由于印刷用铅版、铅字、铜模,使用中都有耗损,也就是都有寿命,因而都要重复地刻铜模、铸铅字、铸铅版。铅版的耐印量为20万印,如果日报印刷40万份,每天就要四次浇铸铅版。铅字、铜模寿命稍长,数月、半年可能需重新刻、铸,并且每个印刷厂都需要不间断的重复这些铅字作业。铅印中繁体字的雕刻、铸造,比简体要麻烦些,用材量消耗量大一些。即使仅大5 %或10 %,由于无休止地重复,劳动量和材料累计性的加大,那繁、简之间差异就十分显著了。而在电脑时代,汉字字库是数字化的,一旦世界上有了一种汉字字库,反复、多次复制就可满足多个、甚至天下所有汉字用户的需求。而且复制并不产生耗损。这样数字化字库就有了几乎是一劳永逸的优点。只要字符集稳定,没有任何瞎折腾,那一套字库用上百年、五百年、千年都是可能的(在字形和字量不变时)。现今方正集团的汉字字库已经非常丰富。基本集(6763汉字)字库字体种类(宋、仿、楷、隶、姚……)已经超过150套;大字符集GBK(21003个汉字)、GB18030—2000( 27484个汉字)也都有四五十种;并且大字符集里的汉字主要是繁体字。确切地说,除外2235个简化字,其余都是繁体(或正体)。方正字库就像一个聚宝盆,天下华人世界每个用户通过简单下载就可以拿来使用,自然要花些费用。但用户越多,单个用户分担的费用就越小。这要比重新开发节省得多。

  “电脑使繁体汉字变得只剩下优点了”

  在电脑化了的情况下,繁、简体还有那些差异呢?我们具体地逐项清理一下。由于每个繁体、简体字都用两个字节表示,所以所消耗的存贮一样。由此,同一文件的繁体版,简体版长度也一样,所以传输速度,编辑加工操作,排序、检索等效率都一样。电脑输入时,如果都用拼音法,差别很少;如果用字形码,差异大一些,但并非总是简体字简便,因为繁体字结构规律更强些。激光打印输出时,打印速度几乎无差别,墨盒寿命可能短些,但差异不会很显著。总体的观察,电脑化时代,繁、简体在操作难易、效率高低上几乎没多大差别。但繁体字结构复杂带来的表意成份丰富、文化含义丰富、与传统文化联系丰富,就成了明显优点。我们甚至可以说:“电脑使繁体汉字变得只剩下优点了”。这您想过吗?您相信吗?你有什么疑问,请告诉我,或请教熟悉汉字电脑信息处理的专家。但请注意:应该慎重听取中国语文学家的高论。因为非常遗憾,始终没有摆脱文改情节的中国语文学家,包括语委某些领导和权威专家,他们至今并没有认清、理解汉字已经电脑化的事实和意义。他们中的一些人,常常带着有色眼睛,专门挑毛病。例如,他们经常谈15*16的汉字字库,使得笔画多的汉字笔画重合,以此作为汉字必须继续简化的理由。早在1995年(1994年,中国已经淘汰了汉字机械打字,淘汰了四码电报,淘汰了铅字排版、印刷,已经被承认为全功能接入互联网的国家)国家语委党组会议精神宣讲中,书记和主任都大谈15*16点阵之缺点。今年国家语委的专家在4月8日和8月12日两次回答为什么不能恢复繁体字时都说过这个理由。但事实上,1988年四通打字机就用了48*48点阵。新世纪以来打印设备(不含抵挡手机)已经全面淘汰了15*16点阵。王选在1980年(大约30年前矣!)成功排印的样书中5号宋体字已经用108*108,封面使用了576*576点阵。这些活生生的基本的、重要的事实为什么就是视而不见呢?某些语文学家身子骨进入电脑时代,脑壳还在铅字时代,还在钱玄同、鲁迅时代。语委领导和专家一直坚持汉字难,汉字是拦路虎,坚持继续已经毫无意义的简化,坚持拒绝繁体字,这正是‘铅字时代的脑壳’PK‘电脑化了的汉字’之图景。

  语委专家对《通用规范汉字表》做的不当解说

  今年语委专家组在对《通用规范汉字表》做解说时说:‘让全国人学用繁体字,那花费太大了’。我要说:(1)在大陆,要求尽快全面恢复繁体字者其实很少。(2)绝大多数人仅仅希望尽快改正简化中明显的失当,特别是同音替代带来的意义含混。按国家语委主办的刊物《语文建设》上专家文章估计,同音替代的字大约100(有的认为200)。这在全部简化字里占不足1/10。不妨先迈出一小步(例如先恢复50~100,即先恢复不足4 % ~8 %的繁体汉字),以后可根据情况再做新的考虑。(3)作为国家强制性技术标准的GB18030-2000已经编码了27484个汉字,其中除外2235个简化字,都是繁(正)体。这些汉字的数十种字体的字库早已建立;输入法也已经设计;在大多数电脑里已经装入;大陆繁体书刊印刷已经在使用;港澳台及大量海外华人已经在使用。大陆公众不能使用仅仅是由于国家语委不承认这些国家标准收录的字是规范汉字,使用它们就是‘繁体字回潮’,‘违反国家文字政策’。这其实正像‘做好的饭不让吃’,‘炒好的菜不让尝’,‘酿好的酒不让饮’,‘做好的衣服不让穿’。反而是:‘偏偏新做了大家不愿意吃的饭,让你吃’,‘ 偏偏新炒个大家不愿意尝的菜,让你尝’,‘ 偏偏新做了件大家不待见的衣服,让你穿’。这不是有些滑稽,有些荒唐吗?

  无视于已经实施的国家技术标准必将碰壁

  当今,技术标准规定的汉字编码字符集是汉字世界信息化的最重要、最根本的基础。自1990年以来,汉字技术标准的制定,已经形成了如下惯例:首先大陆专家与港澳台专家协商,形成中国提案;再与日韩专家协商形成汉字圈国家、地区统一提案;提交国际标准化组织讨论、确定、公告。当今的世界已经是地球村。万千种、亿万台文字处理设备(手机,微机,服务器,汉字雕刻机,银行存折补打机,....),都是由分布在世界各地众多企业设计、生产的,都是在技术标准严格约束下运行的。新增加一个汉字,改动一个汉字字形,往往涉及现今运行中的亿万台设备的改造或适配性更新,涉及二三十年来积累的数字资源的变更。这种更新、改造可能根本无法完成,或者强行实施而造成严重破坏。国家语委完全无视于已经实施的国家技术标准。根据长期从事汉字标准制定、管理的工信部工程师王立建对公告的《通用规范汉字表》统计:“有1653个字不在GB2312(包含6763个汉字)里;有275个字不在GB18030-2000(包含27484个汉字)里。这就意味着,275个(或者1653个,取决于计算机使用哪种字库)新字,是无法输入电脑的”。据王立建说,“它们只能等待被纳入国标字库,并排在已有的9万多字的后面(待遇等同生僻字)。而想要进入国标字库,还需要大陆与港、台、日、韩取得共识,但新字能否被大陆以外承认,得打个问号”(参见王立建对网易记者的谈话,见网易新闻)。国家语委原来本想自己制定一个完整独立的8300汉字集。到头来这些字在现行技术标准里是分散无序的。为了8300全部进入标准,一些新字必须放置在9万汉字之后。换句话说,就是至少先要释放GB18030-2000之中近2万汉字,才能使用全部8300个汉字。真是‘偷鸡不成失把米’呀!这不又是一宗滑稽,荒唐事吗?如果在铅字时代,只要在某个印刷厂新造个(些)铅字,完成印刷即可。那时只要肉眼阅读者认得就行。那时没有什么数字化资源。国家语委某些领导、专家确实是在用“铅字时代的头脑‘规范’电脑化了的汉字”。

  政治影响

  以上所述还主要是技术方面的考虑。其政治影响至少有:(1)如果《通用规范汉字表》获得批准实施,那就把港澳台和海外华人世界所有使用繁体汉字的人打入“整天使用非规范汉字的人群”。这不利于中华民族的团结,给中央处理港澳台和华侨事务增添了麻烦。(2)《通用规范汉字表》获得批准实施将否定已经执行多年的编码技术标准,开国家自己内部两个部门相互争斗之恶劣先例。

  事实已经表明:国家语委没有能力从事电脑时代汉字规范工作。中央应当成立专门领导小组(建议由国务院办公厅,人大办公厅,中宣部,总政治部等单位抽调少数人组成)审定《通用规范汉字表》。主持两三场电视直播的答辩会。请国家语委领导和专家向公众公告收集意见后的方案,并公开接受各有关机构和公众的质询。为中央最后决策做好舆论和文件的准备。

  作者曾和三四十位语文学家有过合作,深知他们的优点、长处和短处。许多长期从事汉字改革的人,对汉字电脑化浪潮表现迟钝、麻木、冷漠;也有一批对新潮流敏感的语文学家,但却几乎全都脱离了语委。国家语委就出现了对汉字电脑化集体的迟钝、麻木、冷漠。《通用规范汉字表》的制定是“用铅字时代的思想‘规范’电脑化了的汉字”的一个典型事件。在当前关于《字表》的讨论中,除44个汉字字形调整被热议外,许多关键问题并没有涉及。这是因为多数技术专家并不重视这些问题。对于技术专家来说,这只是普及应用中的问题,已经完全没有什么高新性质;再者,许多技术专家觉得某些语文学家高傲、自负,又缺乏起码信息技术常识,无法沟通。对于普通公众来说,电脑化过程的秘密,都隐藏在芯片里,一点也不直观、感性、外露。故本文谈及的许多东西大家并不了解。这些是本文作者最担心的。所以才写了这篇文字。


4
 楼主| 发表于 2012-11-11 17:47:02 | 只看该作者
本帖最后由 sanwsw 于 2012-11-11 17:54 编辑

  许寿椿,中央民族大学教授。1963年毕业于北京大学数学力学系并留校任教。1985年调人中央民族学院任教,从事计算机软件、离散数学、中文信息处理等教学和研究工作。曾获国家科技进步三等奖、国家民族事务委员会科技进步一等奖。发表论文80余篇,著作11种,其中畅销书类著作有:《文字编辑与电脑打字》(中央民族大学出版社,1988年),《电脑打字实用教材》(清华大学出版社,1993年),《电脑文字编辑与数据处理》(清华大学出版社,1993年)。

  一楼文档的电子文稿须CAJViewer阅读。

   用铅字时代思想规范电脑化了的汉字,必将碰壁——评说《通用规范汉字表》.caj.rar (471.8 KB, 下载次数: 1234)
5
发表于 2012-11-11 19:01:32 | 只看该作者
不管如何,不折腾是大众喜欢的。
6
发表于 2012-12-21 22:40:49 来自手机 | 只看该作者
让十三亿去迁就一部分人。想法太奇葩了。
7
发表于 2012-12-24 09:38:22 | 只看该作者
8
发表于 2013-8-29 21:28:14 | 只看该作者
  大哥不说二哥,这位许先生对汉字的认识也强不到哪里去。
9
发表于 2013-8-29 23:50:23 | 只看该作者
文字统一——走向规范化,大方向是对的。秦始皇王朝就在搞 “书同文” 了呵呵!
10
发表于 2013-8-31 10:16:31 | 只看该作者
日常使用的字表收字宜少不宜多。
日语常用汉字表收字2136个。

我们的GB2312收字6763个。
这6763个字,任何电脑任何字体均可打出
11
发表于 2013-9-1 22:16:27 | 只看该作者
所谓的字符集,是按照西方人的思想制作的,只是按照制作时的字频进行分类收集,一旦确定,无法改变;而中国人的想法,常用的就应该排前面、长期不用的就挪到后面去,过一段时间就重新来一次,即《通用规范汉字表》。按照西方人的思想来做中国的事情,当然矛盾是少不了的。
12
发表于 2013-10-1 16:36:29 | 只看该作者
谢谢转载,看了,很有收获。
头像被屏蔽
13
发表于 2013-10-17 00:22:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
14
发表于 2013-10-17 11:57:28 | 只看该作者
本帖最后由 dbpxaSA6Kp2o 于 2013-10-17 12:01 编辑

简化汉字,我基本不反对,但要简得科学。简化方案,我不喜欢的一点,是併字。例如,並排的並,合併的併,统统并入“并”。两河并流,到底是“併流”还是“並流”?外行人看到“并行处理”,会搞不清楚。如果是“並行处理”,那就比较明白了,至少不会误以为是“併行处理”。併字方案,还併了其他字,我觉得用起来,都不方便。《神雕侠侣》和《神鵰侠侣》,字义就差很多。雕刻,鵰刻,很不一样呢。複明,復明,按理说,也不一样。Occultation 是掩星再现(recurrence),故译为“複现” http://baike.baidu.com/view/5437350.htm。它不是“恢復出现”哦。康復,不是康複。这里,需要提提“影后”和“影後”的笑话吗?还有其他,此不赘。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-23 19:07

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表