华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
楼主: sanwsw
打印 上一主题 下一主题

汉文博士——支持生僻古难字检索的开放式免费汉语词典

[复制链接]
31
 楼主| 发表于 2013-2-26 15:20:35 | 只看该作者



  0.5.1.1**版的数据库、辞书可通用,无须重新下载。

点评

戴老师: 我也是刚才发现的,正准备在您这个帖子里发帖,发现您已经早我一小时发帖了呵呵!  发表于 2013-2-26 16:58
32
发表于 2013-2-26 17:53:05 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-1 21:17 编辑
sanwsw 发表于 2013-2-26 15:20
  0.5.1.1**版的数据库、辞书可通用,无须重新下载。


【汉文博士0.5.1.1077字词库说明】

    本软件的字词库文件,和前版本“汉文博士0.5.1.1070”的

字词库文件是通用的。
    明细如下:

(一)本软件自带的字词库文件:
    1、CC-CEDICT.hzd
    2、Unihan 缩简版.hzd
    3、表意文字描述序列(IDS).hzd
    4、汉字部件数据.hzs
    5、基础数据.hzs

(二)和前版本通用的字词库文件:
    1、Unihan.hzd(使用中发现,采用Unihan 缩简版.hzd即可)
    2、中华成语大词典.hzd
    3、重编国语辞典修订本.hzd
    4、康熙字典.hzd
    5、説文解字.hzd
    6、汉语辞海.hzd
    7、中国历代职官词典.hzd
    8、中國古代史辭典.hzd
    9、常用古体诗词韵书.hzd
    10、常用国字标准字体表.hzd
    11、汉字五笔编码与笔顺.hzd
    12、汉字构形数据库.hzd
    13、现代汉语通用字表.hzd
    14、现代汉语常用字表.hzd
    15、秦印文字汇编索引.hzd
    16、粤方言字表.hzd
    17、粤语破音、异读字表.hzd
    18、粤语审音配词字库.hzd
    19、诗词典故词典.hzd
    20、汉语大词典.hzd
33
 楼主| 发表于 2013-2-26 22:19:17 | 只看该作者


更新:
0.5.1.1145 2013年2月26日
新增功能:
        切换到主窗口后自动检索剪贴板内容的选项。
        单击词条列表检索词条的选项。
        构形检字功能可按笔画排序自定义常用部件。
修改功能:
        程序信息界面。

0.5.1.1077 2013年2月24日
从本版本开始,《汉字速查》更名为《汉文博士》。
新增功能:
        新的压缩词典格式,支持图文混排,优化模糊词条检索性能,优化了压缩比例。
        词典数据库编译器,可自行制作字典、词典数据库文档。
        导出字库为图片的工具。
        F12 键切换最近检索的内容。
        检字列表可以字表筛选汉字。
        检字出词。
        筛选、复制、保存词条列表。
        模糊检索词条时,可选择使用哪些词典的词条。
        词条列表显示包含词条的词典数。
        字典检索结果显示 GB-18030 编码值。
        保持程序窗口总是可见的按钮。
        保存检索结果为网页文件。
        更改检字列表的字体尺寸。
        部首检字界面可通过输入部首笔画或包含部首的字来快速定位需检索的部首。
        在检索词条栏输入文本时执行自动模糊检索词条,按光标“↓”键可跳转到词条列表选择词条。
修改功能:
        轮换检索历史,增加“前进”功能,工具栏上的“历史”按钮改为“后退”按钮。
        读音检索列表的声母和韵母可以多选。
        字典检索栏中,在统一码输入框中按下回车键将直接按统一码检索。
        字典检索栏中,输入汉字后自动执行检索。
        优化了词典中的单字检索效率。
        自动安装词典时跳过版本不符或无法加载的词典。
修复错误:
        词典格式错误或不匹配导致无法正常读取程序配置。
        打开程序时没有在任务栏显示程序图标。
        异体通查检索可能没有返回所有结果。
        字典检索功能无法检索汉字区块最后一字。
        在字典检索文本框中执行撤销命令时程序可能会崩溃。
        无法使用输入法输入复码(Surrogate Pair)汉字。
        程序在检索包含错误字符的词条时会崩溃。
        大字体设置下检字框显示字体不完整。


点评

看到了呵呵!  发表于 2013-2-26 23:25
34
发表于 2013-2-26 23:51:03 | 只看该作者
sanwsw 发表于 2013-2-26 22:19
更新:
0.5.1.1145 2013年2月26日
新增功能:

这个0.5.1.1145的版本改得真好,那个自定义的部件表,终于按笔画排序了呵呵!  
35
发表于 2013-2-28 20:23:51 | 只看该作者
sanwsw 发表于 2013-2-26 22:19
更新:
0.5.1.1145 2013年2月26日
新增功能:

希望戴老师转告“汉文博士”作者——

在“汉文博士”软件中,已经有了汉字的五笔编码和笔顺查询字典。建议在此基础上进一步扩展功能,实现笔画和五笔查询汉字呵呵!
36
发表于 2013-3-1 18:28:55 | 只看该作者
好消息:“汉文博士”的版本已经更新到了0.5.1.1154。更新日期2月28日。
37
发表于 2013-3-4 16:54:31 | 只看该作者
“汉文博士”版本已经更新到了0.5.1.1190。
38
 楼主| 发表于 2013-3-7 20:59:04 | 只看该作者
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg
39
发表于 2013-3-7 22:29:45 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-7 22:35 编辑
sanwsw 发表于 2013-3-7 20:59
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg
(一)前两天就发现了,并下载使用了呵呵!只因为这两天在搞一个小字典,所以才没时间在这里发帖。

(二)
    戴老师:
    忙乎了几天,终于弄出了一个能在汉文博士里使用的《U+私用区汉字字典》。
    本字典收录了国际统一码私用区 U+E600~U+E6CE 之间的207个汉字。这些汉字在汉文博士里原本是都检索不出来的,通过这个小字典,便可以检索出来了。
    检索方法:
    1、汉字检索法:可将这207个其中的汉字,直接拷贝进搜索栏,将其检索出来。检索出来后,便可查阅相关的释文了。
    2、构形、部首或拼音检索法:通过以上列出的诸检索法,可检索到对应的繁体或“a同b”的变体字,然后在对应变体字的《U+私用区汉字字典》里,反查到对应的变体字,再通过右键选项,跳转到对应变体字的释文。
    3、“生僻字”检索法:对于少数没有对应变体字,用构形、部首或拼音检索法无法检索出来的字,则可以通过输入“生僻字”这三个字,进入《U+私用区汉字字典》的生僻字页面进行查阅。
    现将这个小字典上传给您,希望您帮忙测试一下,并多提些改进意见。

下面是经多次测试,多次修改了的《U+私用区汉字字典》:
《U 私用区汉字字典》.rar (10.25 KB, 下载次数: 643)

点评

很好,功德无量。  发表于 2013-3-10 18:57
40
发表于 2013-3-8 13:39:12 | 只看该作者
sanwsw 发表于 2013-3-7 20:59
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg

汉文博士更新的挺快的嘛。好东西要收藏
41
发表于 2013-3-10 21:11:27 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-10 23:18 编辑

@sanwsw
回“sanwsw  很好,功德无量。  发表于 2 小时前 ”。
戴老师:

您太过奖了呵呵!

另有一事请教:
原先是“汉文博士”检索不出 U+E600~U+E6CE 之间的207个汉字。自从使用了《U+私用区汉字字典》后,是能够检索出那207个汉字了,但在使用中却发现了另一个问题:就是使用“超大字符集支持包Unifonts 6.0”安装的字体,可以在释文中显示那207个汉字;而用“花园明朝体-大字符版”和“方正超大字符集楷体”,则都不能在释文中显示那207个汉字。您也是这种情况吗?
42
 楼主| 发表于 2013-3-11 08:30:12 | 只看该作者
这是自然。那207个汉字,尚未进入Unicode6.1,花园明朝体没有收录这些汉字。“国际标准超大字符集字体支持包UniFonts6.0”安装包带了特殊字体,才能显示。
43
 楼主| 发表于 2013-3-11 13:49:21 | 只看该作者
本帖最后由 sanwsw 于 2013-3-11 13:55 编辑




  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4
  115网盘礼包码:5lba3h4
44
发表于 2013-3-11 17:21:31 | 只看该作者
sanwsw 发表于 2013-3-11 13:49
  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4 ...

看来还是Unifonts 6.0的功能最强呵呵!
45
发表于 2013-3-11 18:26:51 | 只看该作者
sanwsw 发表于 2013-3-11 13:49
  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4 ...

戴老师:
“汉文博士”的作者于“0.5.2.1210”版时,就在“字典及词典数据库”里删减了原有的“汉字构形数据库.hzd”。
但我在使用中发现,删减“汉字构形数据库.hzd”后,就没有详细的异体汉字信息了。见下图:



因此,我现在就依然保留了“汉字构形数据库.hzd”在使用,没有发现与改进后的“汉字部件数据.hzs”及构形检字功能有冲突。
46
 楼主| 发表于 2013-3-12 09:10:04 | 只看该作者
如果字典搜索结果字体设为方正楷体、楷体等,系统注册表中要为这些楷体链接上SunmanPUA.ttf,才能显示SunmanPUA.ttf字体所带的207个私用区汉字。

点评

戴老师: 按一般常规讲,在安装某种字体的时候,安装信息就会自动进入操作系统的注册表。如果要手动修改注册表,我还没有这方面的资料呢呵呵!  发表于 2013-3-12 11:58
47
发表于 2013-3-12 15:29:57 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-12 15:31 编辑
sanwsw 发表于 2013-3-12 09:10
如果字典搜索结果字体设为方正楷体、楷体等,系统注册表中要为这些楷体链接上SunmanPUA.ttf,才能显示Sunma ...
戴老师说:灵格斯词库是很容易转换成汉文博士词库的……

我用深蓝试了一下,呵呵,转换出来的全是词条,没有释文,有什么用啊?
48
发表于 2013-3-14 12:04:26 | 只看该作者
@sanwsw

戴老师:
又制作了一个《辞海中国近代史分册》的汉文博士词典,词条875条。
在汉文博士现有的词典中,只有“中國古代史辭典.hzd”,查阅了“汉语辞海.hzd”中的近代史词条,发现没有“辞海历史分册-中国近代史.pdf”齐全,因此就参照“辞海历史分册-中国近代史.pdf”,制作了这个《辞海中国近代史分册》的汉文博士词典。
也传给您共享呵呵!
辞海中国近代史分册.rar (243.76 KB, 下载次数: 703)

49
 楼主| 发表于 2013-3-14 13:40:13 | 只看该作者
汉文博士V0.5.2.1270(带24部辞书).rar,大小:146.42MB
115网盘礼包接收地址:http://115.com/lb/5lbsgi4
115网盘礼包码:5lbsgi4
50
发表于 2013-3-14 17:15:34 | 只看该作者
又一个正式版横空出世了
51
发表于 2013-3-14 19:55:58 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-14 19:57 编辑
sanwsw 发表于 2013-3-14 13:40
汉文博士V0.5.2.1270(带24部辞书).rar,大小:146.42MB
115网盘礼包接收地址:http://115.com/lb/5lbsgi ...
戴老师:

又弄好了一部汉文博士词典——《辞海历史的地理分册》,也是完全参照“辞海地理分册-历史的地理.pdf”制作的,四千多词条。

也传给您共享呵呵!

辞海历史的地理分册.rar (971.42 KB, 下载次数: 724)
52
 楼主| 发表于 2013-3-14 20:33:52 | 只看该作者
老王手工输入?历史分册发现错别字。
53
发表于 2013-3-14 22:30:51 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-14 23:09 编辑
sanwsw 发表于 2013-3-14 20:33
老王手工输入?历史分册发现错别字。


戴老师:
    不是手工输入的,是用pdf电子书转换后,又用正则表达式、Excel等整理的。在整理时,只纠正发现了的明显错误。
    您还不知道有些电子书的质量吗?特别是早期的文字版。请参看原件—— 【历史辞书】.rar (2.69 MB, 下载次数: 594)
   
    就是现在汉文博士使用的“汉语大词典”,我也发现有很多疏漏之处,和光盘版的《汉语大词典》不是一码子事呵呵!总之把它放在汉文博士里面,查阅起来要比其它电子书方便多了^_^

    另外,您要不要我整理出来的txt原件啊?如要的话,我可以发到您的邮箱,您抽时间改一下。我可耐不得哪个烦呵呵!
54
发表于 2013-3-15 23:00:58 | 只看该作者
sanwsw 发表于 2013-3-14 20:33
老王手工输入?历史分册发现错别字。

戴老师:

    这是经汉文博士老师修改配置文件后,又重新制作的《U+私用区汉字字典》,和原先的区别是——可以在释文中,进行繁简字的相互跳转……
U 私用区汉字字典.rar (10.49 KB, 下载次数: 631)
55
 楼主| 发表于 2013-3-16 14:54:39 | 只看该作者

老王,查查看,这“?”(?口当)字的注释不完整吧。
56
发表于 2013-3-16 18:01:02 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-16 19:44 编辑
wsw 发表于 2013-3-16 14:54
老王,查查看,这“?”(?口当)字的注释不完整吧。
戴老师:是这样的——

①这个“ ”字没有拼音,现在,我们只假定是用户不知道拼音,因此,只能用汉文博士的构形检索根据来查找。见下图:


②其实,用户用构形检索工具查找出来的“ ”,是扩展C区的“ ”字。单击该字《U+私用区汉字字典》释文中后面的那个“ ”字,才可以跳转到私用区的“ ”字。见下图:



根据“字海网”http://yedict.com/的解释——私用区的 扩展C区的 ”。

不知戴老师指的是那方面的注释不完整。
57
 楼主| 发表于 2013-3-17 09:50:25 | 只看该作者
看来是我的系统或浏览器问题,无法完整显示。^_^^_^
58
发表于 2013-3-17 15:55:24 | 只看该作者
本帖最后由 wangyanhan 于 2013-3-17 15:56 编辑
sanwsw 发表于 2013-3-17 09:50
看来是我的系统或浏览器问题,无法完整显示。^_^^_^


戴老师:

我想,您的这种情况,可能是系统字库导致的。

经汉文博士老师修改后的《U+私用区汉字字典》,在说明中强调:必须要安装孙海峰字库……。见下图:

59
 楼主| 发表于 2013-3-18 19:21:48 | 只看该作者
本帖最后由 sanwsw 于 2013-3-28 11:56 编辑

汉文博士V0.5.2.1440.rar
115网盘礼包接收地址:http://115.com/lb/5lbqq12g
115网盘礼包码:5lbqq12g
60
 楼主| 发表于 2013-3-28 11:56:21 | 只看该作者


您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-23 20:28

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表