|
|
本帖最后由 wangyanhan 于 2013-5-21 08:21 编辑
友情共享现代汉语常用词词库(修改稿)和“现代汉语常用词词库”
这是我在网上觅到的《现代汉语常用词表》,并将其制成了开源的华宇词库,现一同放出来共享呵呵!
《现代汉语常用词表》,《现代汉语常用词表》课题组 编,商务印书馆出版社。《现代汉语常用词表(草案)》提出了现当代社会生活中比较稳定的、使用频率较高的汉语普通话常用词语56008个,形成《现代汉语常用词表(草案)》,给出了词语的词形。《现代汉语常用词表(草案)》的词语收录,既注意词语的系统性,又注意词语在语用中的实用性。
请参看百度百科_"现代汉语常用词表"词条
http://baike.baidu.com/view/6328845.htm
(一)《现代汉语常用词表》内容摘览:
《现代汉语常用词表》课题组 编
商务印书馆出版社
词组 拼音 次序
——————————
阿爸 a1'ba4 18137
阿昌族 a1'chang1'zu2 50849
阿斗 a1'dou3 42632
阿飞 a1'fei1 48603
阿富汗 a1'fu4'han4 3461
阿訇 a1'hong1 34432
阿拉伯数字 a1'la1'bo2'shu4'zi4 35937http://bbs.pinyin.thunisoft.com/forum.php?mod=attachment&aid=MTIyODN8ODY1N2RiMGUyMWVjNTRkZDUyYTRkNjAwZTUyYTcyYjN8MTc2NjU4NTk1Mg%3D%3D&request=yes&_f=.rar
……
(二)“现代汉语常用词词库”说明:
在《现代汉语常用词表》一书中,原有3000多个单字。最初,本人将单字剔除后,就直接套用原书的汉语拼音和次序(词频),将其制成了“现代汉语常用词词库”。
昨晚(2013年5月20日),蓝天版主在测试中发现:原书的次序(词频)是按降序排列的——即次序数越大,词频就越低。这种词频数,和华宇输入法的词频数完全相反。
从昨晚到今早,我已将该词库的词频换成了官方系统词库的词频。约有1000个词条,官方系统词库中没有,则是用其它华宇词库词频替换的。希望已经下载使用该词库的60位网友,迅速更新。
在此,对蓝天版主的精心测试和及时指正,也表示衷心感谢呵呵!
现代汉语常用词词库(修改稿).zip
(1.64 MB, 下载次数: 11751)
|
|