华宇拼音输入法论坛

标题: 【词库】紫光拼音清一词库1.1版发布 [打印本页]

作者: yaclear    时间: 2007-11-16 18:12
标题: 【词库】紫光拼音清一词库1.1版发布
提示:

除了紫光官方网站上的下载网址:

http://www.unispim.com/wordlib/wordlib_detail.php?id=19

之外,也可到这个分流地址下载:

http://www.isload.com.cn/store/rky4fv2c3fcai/%D7%CF%B9%E2%C6%B4%D2%F4%C7%E5%D2%BB%B4%CA%BF%E21.1.zip/downlaod

┌────────────┐
│紫光拼音清一词库1.1_说明│
└────────────┘

───────────────────────────────────────

一、词库简介

  紫光拼音清一词库意在为偏好词语输入(而非整句输入)的紫光拼音输入法用户提供
一款适量规模的免费词库。

  紫光拼音清一词库目前的最新版本是1.1版,发布日期为2007.11.16,共包括了56万
2千余词条。

───────────────────────────────────────

二、制作缘由

  对于拼音输入法用户来说,在选择大词库与小词库时面临着不同的利弊。大词库的词
条相对于小词库来说更为繁多,在减小用户自组词几率的同时,也不可避免地带来了一定
的选词复杂度。词库容量介于“海量词库”与“精简词库”之间的适量规模的词库,无疑
地更适合多数拼音输入法用户的需要。

  由fengyu29[王瑞辉]制作的“紫光大词库完美优化版”系列,即可看作“适量规模的
词库”之典型代表。然而,它仍有许多不尽人意之处,主要有以下几点:

  1、收录的不少词条,属于无助输入的废词。

  2、收录的不少词条,对于偏好整句输入的拼音输入法用户来说不无益处,但对于偏
好词语输入的拼音输入法用户来说显得冗余。

  3、收录的一些词条,含有或字或音的错误。

  4、收录的一些词条,或使用率低,或过于专业。

  5、收录的日常词条,在数量上与范围上都有不足。

  有感于此,决定在“紫光大词库完美优化版”的基础上,着手为偏好词语输入的紫光
拼音输入法用户整理制作一款适量规模的免费词库。

───────────────────────────────────────

三、更新列表

 ☆2007年11月

  发布紫光拼音清一词库1.1版,包括词条56万2千余,其中已审查词条9万6千余。

  由紫光拼音开发组根据最新的语料库词频资料进行词频优化。

  其他审查整理工作。

  根据“常见古诗文汇集”等,添加若干古诗文名句词条。(清一本人的少数旧体诗句
也收录在内,看看你能否找到?^^)

  根据“文笔要诀”,添加若干文言虚词词条。

 ☆2007年10月

  整理若干由多音字引起的错误词条。

  根据“常见熟语辑录”等,整理若干熟语词条。

  添加若干北京市区地名词条。

  根据“中国211、985大学分布图”,添加若干内地大学名称词条。

  审查整理五字词条完毕。

  添加若干日常词条。

 ☆2007年9月

  复查整理六字及六字以上词条完毕。

  发布紫光拼音清一词库1.0版,包括词条51万9千余,其中已审查词条1万8千余。

  由紫光拼音开发组根据最新的语料库词频资料进行词频优化。

  其他审查整理工作。

  添加若干数量词条。

  添加若干时刻词条。

  根据“人体108穴位汇总”,添加若干中医穴位词条。

 ☆2007年8月

  根据“108个常见多音多义字”等,整理若干由多音字引起的错误词条。

  根据“中国历代爵位要览”,添加若干古代爵位词条。

  根据“中国历代官制名词简释”,添加若干古代官职词条。

  审查整理六字及六字以上词条完毕。

  删除若干乡村基层(县级以下)地名词条。

 ☆2007年7月

  删除若干不文明词条。

  删除若干非知名的人名词条。(清一本人及亲友若干例外,^^)

  以“紫光大词库完美优化第四版”为基点,开始审查整理工作。

───────────────────────────────────────

四、下载地址

  http://www.unispim.com/wordlib/

───────────────────────────────────────

五、安装办法

 ☆适用的输入法版本:

  紫光拼音输入法V6beta以上版本。

 ☆推荐的词库使用环境:

  紫光拼音输入法V6正式版+中日韩汉字超大字符集(SuperCJK)通用字体支持包 5.3

 ☆词库的安装办法:

  开始菜单->紫光拼音输入法->设置->字词库管理->词库管理->添加->选择添加紫光拼
音清一词库1.1->勾选使用即可。

  验证词库安装成功,可依据能否打出词库特征词:清一词库一点一 来判断。

 ☆注意:

  在Windows登录后已打开紫光拼音输入法使用的情况下,安装词库后可能需要一次注
销或重启,在新次登录后得以生效。

 ☆注意:

  不推荐本词库与紫光拼音系统词库并存使用,因为两者是各自独立整理的词库,面向
不同的对象、具有不同的风格。同时,亦不推荐本词库与“紫光大词库完美优化版”并存
使用——除上述原因外,还因为后者内含了许多本词库内已行删除或修正的词条。

───────────────────────────────────────

六、致谢说明

  感谢fengyu29[王瑞辉]为制作“紫光大词库完美优化第四版”所付出的长期辛勤劳动,
这为本词库的整理工作奠定了很高的基点。

  感谢fengyu29[王瑞辉]同意在“紫光大词库完美优化第四版”基础上进行的本词库整
理工作。

  感谢紫光拼音开发组根据最新的语料库词频资料对本词库进行了词频优化。

───────────────────────────────────────

清一(yaclear@newsmth)

2007.11.16

───────────────────────────────────────
作者: yaclear    时间: 2007-11-16 18:16
另外还要烦请版主把清一词库下载页面:

http://www.unispim.com/wordlib/wordlib_detail.php?id=19

内的“作者:清一”改为:“作者:清一(yaclear@newsmth)”

并且该页面上的词库说明,也宜将“紫光拼音清一词库1.1_说明”引全。
作者: 得闲饮茶    时间: 2007-11-16 18:29
词库简直就是输入法的命
作者: ShingU    时间: 2007-11-16 19:14
这个词库看起来不错,试试看。
作者: ShingU    时间: 2007-11-16 19:30
看了简介:
紫光拼音清一词库意在为偏好词语输入(而非整句输入)的紫光拼音输入法用户提供
一款适量规模的免费词库。

觉得这是适合我的一个词库,因为我就是偏好词语输入,而非整句输入。
作者: 得闲饮茶    时间: 2007-11-16 19:41
我也用试一下
作者: ShingU    时间: 2007-11-16 19:43
 ☆推荐的词库使用环境:

  紫光拼音输入法V6正式版+中日韩汉字超大字符集(SuperCJK)通用字体支持包 5.3

前面的是什么大家都知道,后面的那个一定要装吗?
作者: yaclear    时间: 2007-11-16 19:54
后面那个是个超大字符集字体支持包,

当然不是一定要装的,

只是当你有——处理很很生僻字(词)的需要的话——有必要装。

另外,安装之后词库的皮肤字体要选宋体才能起到效果。

下面是它的说明文件:

  支持CJK-ExtC的超大字符集字体支持包:Unifonts5.3

  ※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

  ※ 中日韩汉字超大字符集(SuperCJK) 通用字体支持包 5.3 ※

  ※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

  ☆ 通用于WinNT/2000/XP/2003/Vista/x64系统下的Unicode全汉字库。

  ☆ 完整支持国际标准超大字符集全部七万多中日韩越汉字的同台处理。

  ☆ 字形版权:中易&华康  配套制作:海峰五笔 http://okuc.net

  ★ 本字库包含近10万标准字符,其中中日韩越通用汉字字符75814个:

  CJK基本   [4E00-9FFF]   20992码位 实际20924字

  CJK扩展A   [3400-4DBF]   6592码位  实际6582字

  CJK扩展B   [20000-2A6DF] 42720码位 实际42711字

  CJK扩展C   [2A700-2BA7F] 4224码位  实际4219字

  CJK兼容扩展  [2F800-2FA1F] 544码位  实际542字

  CJK部首扩展  [2E80-2EFF]   128码位  实际116字

  CJK康熙部首  [2F00-2FDF]   224码位  实际214字

  CJK笔画    [31C0-31EF]   48码位   实际36字

  CJK兼容      [F900-FAFF]   512个码位  实际474字

  下载地址: http://okuc.ys168.com

  ★ 版本更新记录:

  ☆  V5.0 - 5.3

  ☆  根据UNICODE5.0增补数十个笔画、音标和修饰符。

  ☆  根据IRG官方公布的的图样,新增CJK-ExtC集的4219字。

  ☆  为方便新旧字形对照,重新挂接了台湾细明体字库MingLiU-ExtB。

  ☆  为兼容不同语言的操作系统,安装时提供了自定义字体和注册表链接的选项。

  ☆  本字体包中的全部汉字均可用《海峰五笔9.4版》、《极点五笔Unicode版》或《小鸭五笔》直接输入。

  ☆  更多应用技巧,参见文化中国论坛(http://culchina.net/bbs) 或 五笔爱好者论坛(http://www.wbfans.com/bbs

  --2007-1-3

  ☆ V4.0

  补全所有的CJK兼容、扩展汉字和全部康熙部首,并增加64个易经卦爻符号、81个太玄经符号,及数百个标点、制表和印刷符号。这完全归功于采采卷耳(王奕桦)的天才工作。

  由海峰重写了字体安装程序,正式加入对64位操作系统的支持,从此可以通用于32位/64位Windows下。配合32/64位通用输入法——海峰五笔9.0版,便能直接输出全部UNICODE汉字。

  --2006.1.11

  ☆ V3.0

  全部汉字都采用了标准宋体字形,避免了大陆与台湾两类字形的不和谐,从此享受无缝挂接、浑然一体的平滑感。

  CJK(GBK):宋体,使用Windows本身内置的SimSun或MingLiU。

  CJK扩展A:Sun-ExtA,来自WinXP的SimSun18030。

  CJK扩展B:Sun-ExtB,来自Vista的SimSun-ExtB。

  真正打在字体包里面的只有后两部分。因为解放了GBK字,体积减至9M,只有前一版本的2/3。

  --2005.10.9

  ☆ V2.0

  减肥50%,删除了方正超大字符集宋体和香港华康宋体,解决了个别网页下显示怪字符的BUG。

  --2005.1.3

  ☆ V1.0

  将多个CJK-A、CJK-B标准字体链接到宋体上,实现了全部七万多UNICODE字符的同台自动显示。

  --2004.11.25
作者: ShingU    时间: 2007-11-16 20:03
谢谢,好像我用不到的。
作者: ccyes    时间: 2007-11-17 16:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: michsun    时间: 2007-11-17 19:44
支持重启后试试,多谢!
作者: wanyjz    时间: 2007-11-17 23:49
刚才安装了清一词库1.1,非常好用!谢谢!!!
作者: ljdqe    时间: 2007-11-18 20:43
有空再下来试一试
做个记号先
作者: summer168    时间: 2007-11-18 23:03
先装了清一词库1.1,今天又安装了紫光优化第五版。没有感觉异常。两个词库都安装有这个必要吗?
作者: fengchun    时间: 2007-11-18 23:04
我觉得两者选一即可,因为很大部分是重复的
作者: 春风化雨    时间: 2007-11-19 00:09
可以提供一个txt的本版吗?!本人很需要!谢谢!邮件:1983382@qq.com
作者: summer168    时间: 2007-11-19 00:13
原帖由 fengchun 于 2007-11-18 23:04 发表
我觉得两者选一即可,因为很大部分是重复的


用哪一个好些,谢谢!
作者: fengchun    时间: 2007-11-19 00:55
我选用的清一词库,还不错。
作者: xukongzhijian    时间: 2007-11-19 08:07
不错 我用这个很好
作者: nf411    时间: 2007-12-16 02:27
感谢分享 感谢 十分感谢 !
作者: gdsmysp    时间: 2007-12-16 11:59
是不是词库越多越好呢?
作者: gdsmysp    时间: 2007-12-16 12:00
也下来装上。多一个总是好的。




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2