华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 10413|回复: 2
打印 上一主题 下一主题

Word2003--词库制作系列软件介绍2

[复制链接]
跳转到指定楼层
1
发表于 2007-12-13 22:09:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Word2003--词库制作系列软件介绍2


  Word应该是大家必备的软件,使用Word一般都没有问题。说到用Word2003制作词库,相信绝大部分一看标题就笑了。但如你想DIY一个称心如意的个性化专业词库,不妨花几分钟看看下文。
  词库制作的步骤不外乎是编辑审核词条--加注审核拼音--处理词条词频--词库格式转换这四步。这是针对系统大词库而言,对于小型的专业词库来说,只要前两步即可,用Word2003完成第一个步骤“编辑审核词条”基本可以胜任,且有意想不到的效果。
  在Word中逐行输入词条。如借用现成文本词库,复制-粘贴即可。问题是复制粘贴后往往需要进行如下的一些处理,此时Word2003就有它的优势了。至于删除空行、删除重复行,建议用EmEditor这个软件。

  ①删除行末或词条中间的空格
  “查找栏”输入^w ,“替换栏”不输任何字符,点击全部替换,即可删除全部空格

  ②删除行末标点,如句号
  “查找栏”输入。^p ,“替换栏”输入^p,点击全部替换,即可删除所有各行的最后句号。问号、叹号参照处理。

  ③删除所有拼音字母、隔音符号和词频数字
  “查找栏”输入[A-Za-z0-9'] ,“替换栏”不输任何字符,并单击“高级”按钮勾选“使用通配符”前的复选框,点击全部替换,即可一次性删除所有拼音字母、隔音符号和词频数字。

  ④将所有词条按音序排列
  如词条数在一二万以内,排序速度还可以。方法:Ctrl+A --  表格 -- 排序 ,按提示进行即可完成排序工作。如词条不多的话,这样处理后可方便地剔除重复词条。

  ⑤删除所有词条后的中文括号及括号内所有字符
  如果词条数量不多,可全选后按 Ctrl+R 使所有词条右对齐,然后在按住Alt的同时用鼠标竖直选中要删除的中文括号文本块然后删除。如果中文括号数量很多,不想逐一删除,可用替换法:“查找栏”输入 ((*)) ,“替换栏”不输任何字符,并单击“高级”按钮勾选“使用通配符”前的复选框,点击全部替换,即可一次性删除所有词条后的中文括号及括号内所有字符。如果所有词条后不是中文括号而是西文括号(网络文章复制后往往如此),在“查找栏”输入 (\(*\)) ,其他同上。

  只有在认真仔细地完成词条编辑、审核之后,方可开始自动加注拼音和拼音审核等后续工作。


[ 本帖最后由 sanwsw 于 2007-12-14 08:44 编辑 ]
2
发表于 2007-12-16 18:59:34 | 只看该作者
先谢谢了,学习交流,支持紫光!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 03:43

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表