华宇拼音输入法论坛

标题: 【60万汉语纯词条】 [打印本页]

作者: wangyanhan    时间: 2013-4-30 21:28
标题: 【60万汉语纯词条】
这是从谢振斌先生的《汉语大词典》词语、灵格斯《汉语辞海》和灵格斯《现代汉语词典》中提出的汉语复词词条,经合并去重复后制成的汉语纯词条,不含一句意群短语,无拼音。对制作词库的网友们可能有些帮助,现放出来共享呵呵!

60万汉语纯词条.rar (1.84 MB, 下载次数: 1002)
作者: cdrwking    时间: 2013-4-30 23:31
不知道紫光的词库中是否包含这些??
作者: 野风    时间: 2013-4-30 23:37
王兄辛苦了!
作者: cdrwking    时间: 2013-4-30 23:43
管理员更辛苦,国定假还加班……
作者: cdrwking    时间: 2013-4-30 23:48
不知道紫光新版何时能出,目前的最新版在win8x64下,无法用辅助工具中的拆字输入……而且win键+空格切换,很不习惯啊……
作者: 野风    时间: 2013-4-30 23:52
是的,6.9版再win8下,总有一些这些或那些问题。
希望能够尽快改进。
作者: kingdick    时间: 2013-5-1 08:10
快捷键习惯就好。
来自:华宇拼音输入法论坛 Windows Phone 8 客户端
作者: cenfit    时间: 2013-5-1 10:20
王老哥辛苦了。好像有不少繁体字。
作者: Loquat-Honey    时间: 2013-5-1 10:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: cdrwking    时间: 2013-5-1 12:29
kingdick 发表于 2013-5-1 08:10
快捷键习惯就好。
来自:华宇拼音输入法论坛 Windows Phone 8 客户端

Windows Phone 8 客户端……
作者: cdrwking    时间: 2013-5-1 12:31
Loquat-Honey 发表于 2013-5-1 10:20
xp下部分字无法显示。用什么软件打开较快?要么不分行要么刷得慢。紫光自己的造词工具时间太久。深蓝软件转 ...

现在好点的记事本软件都能打开……我用的是AkelPad
作者: wangyanhan    时间: 2013-5-1 12:43
这个“中文记事本”打开txt大文件是很快的。别看它小,可功能多多,有支持中文的强大正则表达式,还有……呵呵!
cnbook.rar (565.56 KB, 下载次数: 713)
作者: wangyanhan    时间: 2013-5-1 12:47
祝版主们和广大坛友们节日快乐!^_^
作者: ljdqe    时间: 2013-5-1 13:18
节日快乐!^_^

作者: Loquat-Honey    时间: 2013-5-1 13:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: 野风    时间: 2013-5-1 17:00
wangyanhan 发表于 2013-5-1 12:47
祝版主们和广大坛友们节日快乐!^_^

祝老王兄节日快乐!
作者: wangyanhan    时间: 2013-5-3 18:37
本帖最后由 wangyanhan 于 2013-5-3 19:44 编辑

“中文记事本(cnbook)” ,除了具有强大的正则表达式功能外,还有一个查找“包含字符串的行”这一特色功能。

举例如下:

1、这是一个示例文本,我们用cnbook把它打开。见下图:


2、在“查找”框里输入一个简单的正则表达式“^我们”,即查找行首的“我们”。
勾选“显示所有匹配项”。然后单击“包含字符串的行”按钮。见下图:


3、这时,就会弹出一个查找结果——《匹配字符串》对话单,其查找的结果全在里面呵呵!见下图:


实际操作证明,用这个功能查找100多万的词库也轻轻松松。这个功能在制作词库时,往往非常有用。

“中文记事本(cnbook)” 是fmddlmyy老师开发的。他本身就是一位正则高手,曾经参与开发过TextPro V6。离开TextPro开发组后,2007年就在TP6的基础上开发了这个cnbook。大约在2007年底,fmddlmyy就在博客里说,有必要增加查找“包含字符串的行”这个功能。cnbook一直更新到2010年,最新版本是“0.6.1”。这个功能,是TextPro所没有的。

当然,cnbook也不是万能的,譬如它不能识别GB18030编码,需要TextPro把GB18030转换成Unicode后才能识别。不过这个转换容易,“另存为”就行了呵呵!

作者: Loquat-Honey    时间: 2013-5-4 08:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: 泡人    时间: 2013-5-5 17:21
这个词库,同一个词简体繁体并存,这样使用时会发生干扰。
如果不喜欢这样,可以删除其中的一种。比如转成简体,去重就可以了。
作者: sanwsw    时间: 2013-5-7 18:23
《汉语大词典》词条应该制成一个独立的词库,因其收录了太多的生僻、冷僻、极冷僻的词语,这样的两字词进入到系统词库不大好。
作者: sanwsw    时间: 2013-5-9 09:43
汉典网的词语,绝大部分取自《汉语大词典》,估计是自动注音所致,汉典网词语解释中,若有多音字,其注音多不可信。
作者: 好休闲    时间: 2013-5-25 08:04
顶一个!




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2