|
|
1975年至1976年,在国家出版局、科学院、新华社领导下,由北京新华印刷厂,人民日报印刷厂的排字工人,以及北京市1500名中学生协同举行了我国解放以来规模最大的“查频统计”。从政治理论、新闻通讯、科技和文艺四类书籍86本、期刊104本、文章7000余篇共2100余万字中进行“查频”,结果是印刷现代书刊一共只用了6335个字。这六千多字中分五类,最常用的即560个,常用字807个,次常用字1033个,共和2400个,这些字占了书刊物汉字出现次数的99%。即是说一个中国人,只要认识2400个字,一般的白话文都可以看得懂。此外,不常用的汉字有1700个,偶出字2165个。
在560个最常用字中,最多的反复出现几十万次,如“的”字,在2000多万字中就出现了83万次。最常用字出现频率最多的是以下42字:“的、一、是、在、了、不、和、有、大、着、主、中、人、上、为、们、地、个、用、工、时、要、动、国、产、以、我、到、他、会、作、来、分、生、对、于、学、下、级、一、就、年、”这42个字,占了报刊用字的四分之一。 |
|