华宇拼音输入法论坛

标题: 汉文博士——支持生僻古难字检索的开放式免费汉语词典 [打印本页]

作者: sanwsw    时间: 2012-11-15 21:05
标题: 汉文博士——支持生僻古难字检索的开放式免费汉语词典
本帖最后由 sanwsw 于 2013-11-29 21:27 编辑

汉文博士——支持生僻古难字检索的开放式免费汉语词典

  汉文博士(原名“汉字速查”,HanziSearcher)是一个支持统一码(Unicode 6.2)七万多个汉字的全汉字集电子字典、词典检索工具。
  ■软件功能
  ●免费的电子词典、字典检索功能。
  ●使用部首笔画、国语拼音、广东话粤拼、汉字部件组合、内码输入等方式检索汉字,可用于输入难检字、生僻字。
  ●集成可扩展的字典和词典功能(现有康熙字典、说文解字、Unihan、CC-CEDICT 等字词典数据库),可用于查询汉字词的读音和释义。
  ●开放式数据结构,使用者可自由从各种文本文件编译生成词典数据库。
  ●音韵检索功能可用于检索同音字、同韵字。
  ●字典查询结果带有超级连接,可在相关汉字之间灵活跳转。
  ●独创关联词语检索功能,可在类似的词条之间相互参照,扩展汉语词汇。
  ●导出字库文字为图片文件的功能。
  
  ■运行环境及软件授权
  WinXP、2003 上运行需安装 .NET Framework 2.0 SP2 (Windows Vista、Windows 7 及更高版本已内置)。
  生僻汉字需要安装相应的字库才能显示,推荐安装花園明朝字库(下载字库文件,解压到Windows系统下的Fonts目录)或孙海峰的 UniFonts 6.0 字库。
  绿色软件,解压即用,完全免费,永不过期。
  欢迎各位网友提供各类字典及词典的原始数据库或已编译数据库。
  
  ■下载链接及说明文档
  下载汉文博士最新版是V0.5.1.1070正式版。http://hanzisearcher.cnblogs.com/
  注意:字典和词典数据库位于上传空间的“字典及词典数据库”目录。
  如下载测试版,该版本位于上传空间的“测试版本”目录,其数据库与之前版本的格式不同,请重新下载字典和词典数据库。
  汉字速查的字典数据库包括统一汉字(Unihan)6.2、异体字及构形数据库、国语词典、康熙字典、说文解字、汉字笔顺等等。
  
  ■关于字典及词典
  添加字典(词典)方法:
  ●方法一:自动安装。将 hzd 文件复制到安装程序目录下的“database”目录,在“词典”菜单选择“管理词典及更改程序选项”,在弹出对话框的“已安装字词典”选项卡中点击“自动安装”按钮,再关闭该对话框即可。
  ●方法二:手动安装。将 hzd 文件复制到硬盘,然后在“词典”菜单选择“管理词典及更改程序选项”,在弹出对话框的“已安装字词典”选项卡中点击“添加”按钮,添加数据库文件。
  管理词典:取消词典左边的方框可屏蔽该词典。上下拖动项目可改变其在查询窗口的显示顺序。
  汉字数据源于统一码汉字数据(Unihan)。
  构形数据库的数据源于台湾中央研究院和 Kanji Database 项目。在制作电子版时,对前者作了少量微调。
  《康熙字典》的数据库来自汉典论坛。

  下载(百度云盘):http://pan.baidu.com/share/link?shareid=369605&uk=3526745603


作者: sanwsw    时间: 2012-11-15 21:14
本帖最后由 sanwsw 于 2012-11-19 20:08 编辑




测试:\u2f8a4    ?忄柬:𢛔。


作者: sanwsw    时间: 2012-11-15 21:16
初步判断,该软件作者是BabelMap软件汉化版作者左伟明。
作者: 古陶瓦    时间: 2012-11-15 22:16
好东西,谢谢老戴,下载备用了。
作者: ljdqe    时间: 2012-11-15 22:41
好东西
必须收藏了
作者: sanwsw    时间: 2012-11-16 12:00
sanwsw 发表于 2012-11-15 21:16
初步判断,该软件作者是BabelMap软件汉化版作者左伟明。

XX网友,感谢您的来信:
  有网友曾提供过《汉语大词典》的文本版数据库,但在下发现其中数据不全,另涉版权问题,不便公开发布。至今只好自用。
  网志下载区的《康熙字典》数据库就是从那个Excel版中制作而成的。该数据源只有文本,没有图片,文本内容似略有错讹。
  我正在开发下一版的《汉字速查》,新版本将提供数据库编译工具。使用者如备有文本文件格式的原始数据,可自行制作数据库。
  在下目前正在修订新版本的数据库结构,并拟添加多媒体功能,但近为公务所烦,故尚未有暇继续开发。
  请阁下继续关注。

                                  左伟明
作者: wangyanhan    时间: 2012-11-16 12:12
本帖最后由 wangyanhan 于 2012-11-16 12:18 编辑

请教戴老师:

这些安装出来的词典数据库文件,是和这个绿色版在一个程序文件夹啊?还是在操作系统的C盘?

作者: boahalong    时间: 2012-11-16 14:32
                       很早  就支持了!!!!
作者: sanwsw    时间: 2012-11-16 14:54
wangyanhan 发表于 2012-11-16 12:12
请教戴老师:

这些安装出来的词典数据库文件,是和这个绿色版在一个程序文件夹啊?还是在操作系统的C盘? ...




作者: wangyanhan    时间: 2012-11-16 17:44
本帖最后由 wangyanhan 于 2012-11-16 17:58 编辑
sanwsw 发表于 2012-11-15 21:14

感谢戴老师这样的有心人啦呵呵!

已经下载试用了,非常棒的。像《康熙字典》等,都重新进行了分条。

为了安装使用这款软件,特意增加了两样东西:①“Microsoft .NET Framework v2.0”运行库。原先安了这个东西,其实只对几个小词库整理工具的运行有用,所以就一直没装。这回这“ .NETFramework v2.0”可派上用场了。②“火狐浏览器”。原先的“360安全浏览器”不能打开数据库的链接。

另外请教戴老师:

1、把数据库都导入后,我的词库怎么没有戴老师的多啊?


2、是不是下图红框里的3个数据文件不需要下载?


3、安装了“Unihan.hzd”资料文件,是不是就可以删除“Unihan 缩简版.hzd”了啊?

作者: sanwsw    时间: 2012-11-16 18:41
1.Unihan 缩简版.hzd,我是删除了的。

2.红框内的第三个,就是目前的最新版软件:HanziSearcher。

3.点击一下“自定安装”按钮试试看。
作者: wangyanhan    时间: 2012-11-16 19:26
sanwsw 发表于 2012-11-16 18:41
1.Unihan 缩简版.hzd,我是删除了的。

2.红框内的第三个,就是目前的最新版软件:HanziSearcher。

戴老师:

谢谢您的解答!

1、我已经知道了,“Unihan”有“缩简版”和“完全版”之分。现在和您一样,我也是把“缩简版”删除了,用的“完整版”。

2、我已经弄到了“汉字速查”的库文件“汉语大词典”,解压后只112MB,比我原先使用的“汉语大词典2.0云龙绿化特别版”小得多,“云龙版”有484MB。不过“云龙版”也是要保留的,因为它是《汉语大词典》光盘版改的硬盘版,原汁原味的。



作者: wangyanhan    时间: 2012-11-16 21:37
本帖最后由 wangyanhan 于 2012-11-16 21:45 编辑

汉字速查使用方法简介
《汉字速查》(HanziSearcher)是一个支持全汉字字典和词典的检索工具。其界面如下所示。
界面上方为工具栏。
左方为字典和词典检索栏。
右方在启动时显示版权信息和作者的联系方式,在执行检索时,显示检索结果。
检索方法
汉字速查提供多种检索方式,包括字头检索、词条检索、部首笔画检索、汉字部件检索、国语拼音检索、粤拼检索、统一码检索。最常见的检索方式是字头和词条检索。现详述如下。
字头检索
启动程序后,在“检索汉字”下面的大型文本框中输入一个汉字,按键盘回车键或点击“查询”按钮,就能列出该汉字的检索数据。如下图所示。

统一码检索
在检索框下方有“十进制统一码”和十六进制统一码两个文本框,在该文本框中,输入对应的统一码编码值,并点击右方对应的放大镜按钮,可跳转到对应的汉字。
词条检索
词条检索用于检索词典数据库的词条。首先,需要点击“词典”选项卡,从字典检索转为词条检索界面。然后在“检索词条”下的文本框中输入待检索的词条,按键盘回车键或点击“查询”按钮,即可检索所安装词典中的词条。
在“检索词条”下有一个“模糊检索词条”列表。在点击“查询”按钮后,会自动根据检索词条检索出类似的词条。双击该列表框中的项目,可转到对应的词条释义。

汉字速查使用方法简介.rar (406.49 KB, 下载次数: 2445)

作者: wangyanhan    时间: 2012-11-16 23:38
@sanwsw

戴老师:

我已经在“消息”里给了您两个下载链接啊!
作者: sanwsw    时间: 2012-11-19 16:56
本帖最后由 sanwsw 于 2012-11-21 13:40 编辑

1.汉字速查,作者博客网页:http://www.cnblogs.com/hanzisearcher

2.汉字速查,数典论坛网页:http://bbs.gxsd.com.cn/forum.php?mod=viewthread&tid=504545&extra=page%3D1

3.汉字速查软件及词典分流:http://sdrv.ms/SQAiYK
作者: wangyanhan    时间: 2012-11-19 20:13
本帖最后由 wangyanhan 于 2012-11-19 22:19 编辑

其实,现在的最新测试版本是:
汉字速查绿色版0.5.0.621
更新列表如下:
0.5.0.621  10月2日
  新增功能:
  新的压缩词典格式,大幅优化模糊词条检索性能。
  历史记录的“前进”功能。
  F12 键切换最近检索的字符。
  检字出词。
  筛选模糊检索列表的词条。
  模糊检索词条时,可选择使用哪些词典的词条。
  检字列表增加以字表筛选汉字功能。
  修改功能:
  工具栏上的“历史”按钮改为“后退”按钮。
  读音检索列表的声母和韵母可以多选。
  修复错误:
  词典格式错误或不匹配导致无法正常读取程序配置的问题。
0.5.0.602 2012年9月29日
  新增功能:
  可自定义查询结果正文的字体。
  修改功能:
  词条模糊检索列表合并了简繁异写词(取简体还是取繁体,要视词条在词典出现顺序而定)。
  优化词条模糊检索的相似度算法。
  修复错误:
  异体通查检索可能返回错误词语的问题。
  无法记住执行词条模糊检索的选项。
0.4.3.507 2012年9月6日
       新增功能:
       可自定义查询结果正文的字体。
       修改功能:
       词条模糊检索列表合并了简繁异写词(取简体还是取繁体,要视词条在词典出现顺序而定)。
       优化词条模糊检索的相似度算法。
       修复错误:
       异体通查检索可能返回错误词语的问题。
       无法记住执行词条模糊检索的选项。

       如下图所示,输入一个“大”字,可模糊检索3530条含“大”字复词、短语及成语、俗语。
       最新测试版的不足是:放出时间短,作者还没有配齐词典文件,目前只有一个《国语辞典》。由于采用了新的压缩词典格式,老版本的词库都不能放进这个版本中使用。
       好在这个版本目前还不大,只有50.7MB,个人觉得可与“0.4.3.507”版并行使用,各有优劣,正好互补。



作者: pzhai001    时间: 2012-11-21 12:09
尊敬的sanwsw (我看别人称您为戴老师,是真的吗?):您好!
  向您请教个问题:您的这个软件与“汉语大词典”和汕头刘夫子的“新华词典”相比,您认为最重要的改进或优势是哪些呢?问此问题,是因为我已经装了上述这两个软件,今天看见您对“汉字速查”这个软件的介绍,觉得挺好的,可是又觉得装多了这类东东会不会有重复的功能,所以向您询问一下。不好意思,麻烦。了,
作者: sanwsw    时间: 2012-11-21 13:19
@pzhai001
  你误会了, 不是我的作品!《汉字速查》应是左伟明先生作品,还在持续改进中,这里发出的是相对稳定版,最新测试版0.5.0.621。这工具是开放式的,作者即将推出的词典编辑工具将允许用户自行编纂辞书。

  汕头刘夫子的“新华词典”我不知道。《汉字速查》 这工具,从我角度看,一是便捷性。因其支持Unicode6.1,能够快捷检索75000多个汉字,生僻字检索毫无问题, 极大地方便了汉字研究爱好者、专业人员的字词检索。所以这工具一经推出,数典论坛用户一片叫好,那个帖子已长期置顶。二是权威性。从已提供的字典、词典来看,辞书、数据库较为经典,基本能够满足一般汉语字词检索需要,特别是《汉语大词典》、《康熙字典》、汉字构形数据库这几本,弥足珍贵。

  网络上的《新华字典》、《新华词典》、《现代汉语词典》等电子辞书,如非原书扫描,其准确性、权威性要打些折扣。从个人爱好、收藏角度,有了《汉字速查》、《汉语大词典》2.0光盘版、《汉语大字典》光盘版(第一版)或《汉语大字典》PDF版(第二版)、《異體字字典》在綫版,足矣。


作者: wangyanhan    时间: 2012-11-21 13:27
本帖最后由 wangyanhan 于 2012-11-21 13:37 编辑

请教戴老师:《汉语大字典》光盘版能用虚拟光驱读出吗?

算了,不问这个问题了。网上查了一下,我的天啦,文件3.2GB大……

有《汉语大字典第二版》pdf电子书就够了,就是检索麻烦一点。用《汉典》离线版配合一下,一般也能检索到。
作者: sanwsw    时间: 2012-11-21 13:36
可以。现在硬盘大到不知道怎么用,将光碟映像文件解压直接放到硬盘,稍加改造做成硬盘版。我就是这样使用光盘版的《汉语大词典》、《汉语大字典》(第一版),非常便捷。
作者: sanwsw    时间: 2012-12-15 18:39
本帖最后由 sanwsw 于 2012-12-15 18:42 编辑

0.5.0.675 2012年12月14日
新增功能:
        新的压缩词典格式,大幅优化模糊词条检索性能。
        历史记录的“前进”功能。
        F12 键切换最近检索的字符。
        检字出词。
        筛选模糊检索列表的词条。
        模糊检索词条时,可选择使用哪些词典的词条。
        检字列表增加以字表筛选汉字功能。
        字典检索结果增加 GB-18030 编码值。
修改功能:
        工具栏上的“历史”按钮改为“后退”按钮。
        读音检索列表的声母和韵母可以多选。
        字典检索栏中,在统一码输入框中按下回车键将直接按统一码检索。
        字典检索栏中,输入汉字后自动执行检索。
修复错误:
        词典格式错误或不匹配导致无法正常读取程序配置的问题。
        打开程序时没有在任务栏显示程序图标的问题。

汉字速查 V0.5.0.675 版下载:
https://skydrive.live.com/?cid=39fc116f9098e840&id=39FC116F9098E840%21105#cid=39FC116F9098E840&id=39FC116F9098E840%21122

http://sdrv.ms/UuQiQQ(已带适用该版本的所有辞书!)
作者: sanwsw    时间: 2012-12-17 13:08





作者: wangyanhan    时间: 2012-12-17 15:14
sanwsw 发表于 2012-12-17 13:08


谢谢戴老师!昨天晚上已经下载更新了呵呵!

这个版本,比官方前不久放出的“汉字速0.5.0.621”测试版强大:一是配套的字词典文件增加了;二是在“构形检索”中,0.5.0.621测试版对非汉字的构形部件不能识别,本版本则可以识别了。

0.4.3.507之后的测试版有个最大的特点——就是能在词典查询栏,用单字模糊查询词条。但0.4.3.507版也不能废弃,主要是它有配套的《汉语大词典》词库文件,而0.5.0.621没有。
作者: sanwsw    时间: 2012-12-17 21:57
wangyanhan 发表于 2012-12-17 15:14
谢谢戴老师!昨天晚上已经下载更新了呵呵!

这个版本,比官方前不久放出的“汉字速0.5.0.621”测试版 ...

适用最新版的《汉语大词典》已经放出!
作者: sanwsw    时间: 2012-12-18 14:25
字体设置建议:



作者: sanwsw    时间: 2012-12-28 17:23
HanziSearcher V0.5.0.698(含18部辞书)已出。
作者: sanwsw    时间: 2013-2-7 13:35
汉字速查 测试版V0.5.1.1010(带22部辞书)

115网盘礼包接收地址:http://115.com/lb/5lblz4t
115网盘礼包码:5lblz4t
作者: sanwsw    时间: 2013-2-22 19:57
汉文博士最新版是V0.5.1.1070正式版,详见一楼。
作者: sanwsw    时间: 2013-2-23 18:49
本帖最后由 sanwsw 于 2013-11-29 21:21 编辑

0.5.3.1944 2013年11月28日
新增功能:
        词典编译器增加检查词条是否以标点符号结尾(检测不完整内容)的选项。
        简繁体、异体字转换。
        汉字文本排序。
        选中单个汉字时显示该汉字的简繁变体和读音。
        修改词条列表字体尺寸的选项。
        打开程序后马上显示启动界面,改善使用体验。
        “每日一字”功能。
        构形输入法支持区块筛选。
修改功能:
        程序加载器检测 .NET Framework 2.0~4.0 是否安装。
        程序自动检测基础数据库是否存在。
修复错误:
        在检字窗口复制的字体没有按显示顺序排序。
        未能正确加载默认值的问题。


作者: 韵酝蕴氲    时间: 2013-2-24 17:06
好东西
作者: sanwsw    时间: 2013-2-26 15:20



  0.5.1.1**版的数据库、辞书可通用,无须重新下载。

作者: wangyanhan    时间: 2013-2-26 17:53
本帖最后由 wangyanhan 于 2013-3-1 21:17 编辑
sanwsw 发表于 2013-2-26 15:20
  0.5.1.1**版的数据库、辞书可通用,无须重新下载。


【汉文博士0.5.1.1077字词库说明】

    本软件的字词库文件,和前版本“汉文博士0.5.1.1070”的

字词库文件是通用的。
    明细如下:

(一)本软件自带的字词库文件:
    1、CC-CEDICT.hzd
    2、Unihan 缩简版.hzd
    3、表意文字描述序列(IDS).hzd
    4、汉字部件数据.hzs
    5、基础数据.hzs

(二)和前版本通用的字词库文件:
    1、Unihan.hzd(使用中发现,采用Unihan 缩简版.hzd即可)
    2、中华成语大词典.hzd
    3、重编国语辞典修订本.hzd
    4、康熙字典.hzd
    5、説文解字.hzd
    6、汉语辞海.hzd
    7、中国历代职官词典.hzd
    8、中國古代史辭典.hzd
    9、常用古体诗词韵书.hzd
    10、常用国字标准字体表.hzd
    11、汉字五笔编码与笔顺.hzd
    12、汉字构形数据库.hzd
    13、现代汉语通用字表.hzd
    14、现代汉语常用字表.hzd
    15、秦印文字汇编索引.hzd
    16、粤方言字表.hzd
    17、粤语破音、异读字表.hzd
    18、粤语审音配词字库.hzd
    19、诗词典故词典.hzd
    20、汉语大词典.hzd

作者: sanwsw    时间: 2013-2-26 22:19


更新:
0.5.1.1145 2013年2月26日
新增功能:
        切换到主窗口后自动检索剪贴板内容的选项。
        单击词条列表检索词条的选项。
        构形检字功能可按笔画排序自定义常用部件。
修改功能:
        程序信息界面。

0.5.1.1077 2013年2月24日
从本版本开始,《汉字速查》更名为《汉文博士》。
新增功能:
        新的压缩词典格式,支持图文混排,优化模糊词条检索性能,优化了压缩比例。
        词典数据库编译器,可自行制作字典、词典数据库文档。
        导出字库为图片的工具。
        F12 键切换最近检索的内容。
        检字列表可以字表筛选汉字。
        检字出词。
        筛选、复制、保存词条列表。
        模糊检索词条时,可选择使用哪些词典的词条。
        词条列表显示包含词条的词典数。
        字典检索结果显示 GB-18030 编码值。
        保持程序窗口总是可见的按钮。
        保存检索结果为网页文件。
        更改检字列表的字体尺寸。
        部首检字界面可通过输入部首笔画或包含部首的字来快速定位需检索的部首。
        在检索词条栏输入文本时执行自动模糊检索词条,按光标“↓”键可跳转到词条列表选择词条。
修改功能:
        轮换检索历史,增加“前进”功能,工具栏上的“历史”按钮改为“后退”按钮。
        读音检索列表的声母和韵母可以多选。
        字典检索栏中,在统一码输入框中按下回车键将直接按统一码检索。
        字典检索栏中,输入汉字后自动执行检索。
        优化了词典中的单字检索效率。
        自动安装词典时跳过版本不符或无法加载的词典。
修复错误:
        词典格式错误或不匹配导致无法正常读取程序配置。
        打开程序时没有在任务栏显示程序图标。
        异体通查检索可能没有返回所有结果。
        字典检索功能无法检索汉字区块最后一字。
        在字典检索文本框中执行撤销命令时程序可能会崩溃。
        无法使用输入法输入复码(Surrogate Pair)汉字。
        程序在检索包含错误字符的词条时会崩溃。
        大字体设置下检字框显示字体不完整。



作者: wangyanhan    时间: 2013-2-26 23:51
sanwsw 发表于 2013-2-26 22:19
更新:
0.5.1.1145 2013年2月26日
新增功能:

这个0.5.1.1145的版本改得真好,那个自定义的部件表,终于按笔画排序了呵呵!  

作者: wangyanhan    时间: 2013-2-28 20:23
sanwsw 发表于 2013-2-26 22:19
更新:
0.5.1.1145 2013年2月26日
新增功能:

希望戴老师转告“汉文博士”作者——

在“汉文博士”软件中,已经有了汉字的五笔编码和笔顺查询字典。建议在此基础上进一步扩展功能,实现笔画和五笔查询汉字呵呵!

作者: wangyanhan    时间: 2013-3-1 18:28
好消息:“汉文博士”的版本已经更新到了0.5.1.1154。更新日期2月28日。
作者: wangyanhan    时间: 2013-3-4 16:54
“汉文博士”版本已经更新到了0.5.1.1190。
作者: sanwsw    时间: 2013-3-7 20:59
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg
作者: wangyanhan    时间: 2013-3-7 22:29
本帖最后由 wangyanhan 于 2013-3-7 22:35 编辑
sanwsw 发表于 2013-3-7 20:59
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg
(一)前两天就发现了,并下载使用了呵呵!只因为这两天在搞一个小字典,所以才没时间在这里发帖。

(二)
    戴老师:
    忙乎了几天,终于弄出了一个能在汉文博士里使用的《U+私用区汉字字典》。
    本字典收录了国际统一码私用区 U+E600~U+E6CE 之间的207个汉字。这些汉字在汉文博士里原本是都检索不出来的,通过这个小字典,便可以检索出来了。
    检索方法:
    1、汉字检索法:可将这207个其中的汉字,直接拷贝进搜索栏,将其检索出来。检索出来后,便可查阅相关的释文了。
    2、构形、部首或拼音检索法:通过以上列出的诸检索法,可检索到对应的繁体或“a同b”的变体字,然后在对应变体字的《U+私用区汉字字典》里,反查到对应的变体字,再通过右键选项,跳转到对应变体字的释文。
    3、“生僻字”检索法:对于少数没有对应变体字,用构形、部首或拼音检索法无法检索出来的字,则可以通过输入“生僻字”这三个字,进入《U+私用区汉字字典》的生僻字页面进行查阅。
    现将这个小字典上传给您,希望您帮忙测试一下,并多提些改进意见。

下面是经多次测试,多次修改了的《U+私用区汉字字典》:
《U 私用区汉字字典》.rar (10.25 KB, 下载次数: 653)

作者: 韵酝蕴氲    时间: 2013-3-8 13:39
sanwsw 发表于 2013-3-7 20:59
汉文博士V0.5.2.1210.rar
115网盘礼包接收地址:http://115.com/lb/5lbtoeg
115网盘礼包码:5lbtoeg

汉文博士更新的挺快的嘛。好东西要收藏
作者: wangyanhan    时间: 2013-3-10 21:11
本帖最后由 wangyanhan 于 2013-3-10 23:18 编辑

@sanwsw
回“sanwsw  很好,功德无量。  发表于 2 小时前 ”。
戴老师:

您太过奖了呵呵!

另有一事请教:
原先是“汉文博士”检索不出 U+E600~U+E6CE 之间的207个汉字。自从使用了《U+私用区汉字字典》后,是能够检索出那207个汉字了,但在使用中却发现了另一个问题:就是使用“超大字符集支持包Unifonts 6.0”安装的字体,可以在释文中显示那207个汉字;而用“花园明朝体-大字符版”和“方正超大字符集楷体”,则都不能在释文中显示那207个汉字。您也是这种情况吗?

作者: sanwsw    时间: 2013-3-11 08:30
这是自然。那207个汉字,尚未进入Unicode6.1,花园明朝体没有收录这些汉字。“国际标准超大字符集字体支持包UniFonts6.0”安装包带了特殊字体,才能显示。
作者: sanwsw    时间: 2013-3-11 13:49
本帖最后由 sanwsw 于 2013-3-11 13:55 编辑




  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4
  115网盘礼包码:5lba3h4

作者: wangyanhan    时间: 2013-3-11 17:21
sanwsw 发表于 2013-3-11 13:49
  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4 ...

看来还是Unifonts 6.0的功能最强呵呵!

作者: wangyanhan    时间: 2013-3-11 18:26
sanwsw 发表于 2013-3-11 13:49
  汉文博士V0.5.2.1258(含23部辞书).rar
  115网盘礼包接收地址:http://115.com/lb/5lba3h4 ...

戴老师:
“汉文博士”的作者于“0.5.2.1210”版时,就在“字典及词典数据库”里删减了原有的“汉字构形数据库.hzd”。
但我在使用中发现,删减“汉字构形数据库.hzd”后,就没有详细的异体汉字信息了。见下图:



因此,我现在就依然保留了“汉字构形数据库.hzd”在使用,没有发现与改进后的“汉字部件数据.hzs”及构形检字功能有冲突。

作者: sanwsw    时间: 2013-3-12 09:10
如果字典搜索结果字体设为方正楷体、楷体等,系统注册表中要为这些楷体链接上SunmanPUA.ttf,才能显示SunmanPUA.ttf字体所带的207个私用区汉字。
作者: wangyanhan    时间: 2013-3-12 15:29
本帖最后由 wangyanhan 于 2013-3-12 15:31 编辑
sanwsw 发表于 2013-3-12 09:10
如果字典搜索结果字体设为方正楷体、楷体等,系统注册表中要为这些楷体链接上SunmanPUA.ttf,才能显示Sunma ...
戴老师说:灵格斯词库是很容易转换成汉文博士词库的……

我用深蓝试了一下,呵呵,转换出来的全是词条,没有释文,有什么用啊?
作者: wangyanhan    时间: 2013-3-14 12:04
@sanwsw

戴老师:
又制作了一个《辞海中国近代史分册》的汉文博士词典,词条875条。
在汉文博士现有的词典中,只有“中國古代史辭典.hzd”,查阅了“汉语辞海.hzd”中的近代史词条,发现没有“辞海历史分册-中国近代史.pdf”齐全,因此就参照“辞海历史分册-中国近代史.pdf”,制作了这个《辞海中国近代史分册》的汉文博士词典。
也传给您共享呵呵!
辞海中国近代史分册.rar (243.76 KB, 下载次数: 714)


作者: sanwsw    时间: 2013-3-14 13:40
汉文博士V0.5.2.1270(带24部辞书).rar,大小:146.42MB
115网盘礼包接收地址:http://115.com/lb/5lbsgi4
115网盘礼包码:5lbsgi4
作者: 韵酝蕴氲    时间: 2013-3-14 17:15
又一个正式版横空出世了
作者: wangyanhan    时间: 2013-3-14 19:55
本帖最后由 wangyanhan 于 2013-3-14 19:57 编辑
sanwsw 发表于 2013-3-14 13:40
汉文博士V0.5.2.1270(带24部辞书).rar,大小:146.42MB
115网盘礼包接收地址:http://115.com/lb/5lbsgi ...
戴老师:

又弄好了一部汉文博士词典——《辞海历史的地理分册》,也是完全参照“辞海地理分册-历史的地理.pdf”制作的,四千多词条。

也传给您共享呵呵!

辞海历史的地理分册.rar (971.42 KB, 下载次数: 739)
作者: sanwsw    时间: 2013-3-14 20:33
老王手工输入?历史分册发现错别字。
作者: wangyanhan    时间: 2013-3-14 22:30
本帖最后由 wangyanhan 于 2013-3-14 23:09 编辑
sanwsw 发表于 2013-3-14 20:33
老王手工输入?历史分册发现错别字。


戴老师:
    不是手工输入的,是用pdf电子书转换后,又用正则表达式、Excel等整理的。在整理时,只纠正发现了的明显错误。
    您还不知道有些电子书的质量吗?特别是早期的文字版。请参看原件—— 【历史辞书】.rar (2.69 MB, 下载次数: 611)
   
    就是现在汉文博士使用的“汉语大词典”,我也发现有很多疏漏之处,和光盘版的《汉语大词典》不是一码子事呵呵!总之把它放在汉文博士里面,查阅起来要比其它电子书方便多了^_^

    另外,您要不要我整理出来的txt原件啊?如要的话,我可以发到您的邮箱,您抽时间改一下。我可耐不得哪个烦呵呵!
作者: wangyanhan    时间: 2013-3-15 23:00
sanwsw 发表于 2013-3-14 20:33
老王手工输入?历史分册发现错别字。

戴老师:

    这是经汉文博士老师修改配置文件后,又重新制作的《U+私用区汉字字典》,和原先的区别是——可以在释文中,进行繁简字的相互跳转……
U 私用区汉字字典.rar (10.49 KB, 下载次数: 642)
作者: sanwsw    时间: 2013-3-16 14:54

老王,查查看,这“?”(?口当)字的注释不完整吧。

作者: wangyanhan    时间: 2013-3-16 18:01
本帖最后由 wangyanhan 于 2013-3-16 19:44 编辑
wsw 发表于 2013-3-16 14:54
老王,查查看,这“?”(?口当)字的注释不完整吧。
戴老师:是这样的——

①这个“ ”字没有拼音,现在,我们只假定是用户不知道拼音,因此,只能用汉文博士的构形检索根据来查找。见下图:


②其实,用户用构形检索工具查找出来的“ ”,是扩展C区的“ ”字。单击该字《U+私用区汉字字典》释文中后面的那个“ ”字,才可以跳转到私用区的“ ”字。见下图:



根据“字海网”http://yedict.com/的解释——私用区的 扩展C区的 ”。

不知戴老师指的是那方面的注释不完整。
作者: sanwsw    时间: 2013-3-17 09:50
看来是我的系统或浏览器问题,无法完整显示。^_^^_^
作者: wangyanhan    时间: 2013-3-17 15:55
本帖最后由 wangyanhan 于 2013-3-17 15:56 编辑
sanwsw 发表于 2013-3-17 09:50
看来是我的系统或浏览器问题,无法完整显示。^_^^_^


戴老师:

我想,您的这种情况,可能是系统字库导致的。

经汉文博士老师修改后的《U+私用区汉字字典》,在说明中强调:必须要安装孙海峰字库……。见下图:


作者: sanwsw    时间: 2013-3-18 19:21
本帖最后由 sanwsw 于 2013-3-28 11:56 编辑

汉文博士V0.5.2.1440.rar
115网盘礼包接收地址:http://115.com/lb/5lbqq12g
115网盘礼包码:5lbqq12g

作者: sanwsw    时间: 2013-3-28 11:56



作者: wangyanhan    时间: 2013-3-29 23:59
本帖最后由 wangyanhan 于 2013-3-30 00:14 编辑



四角号码检索示例:



构形检索示例:



可以输简查繁:



这是“汉文博士”检索功能的三大优势呵呵!

作者: wangyanhan    时间: 2013-4-30 19:18
sanwsw 发表于 2013-2-8 10:23
非常看好115网盘,建议申请一个。

戴老师:前两天,无意中发现用QQ号也可以注册115网盘,就注册了一个。初始网盘容量就是15GB,装了一个1MB多的小控件后,上传飞快,确实不错!谢谢您当初的推荐呵呵!
作者: 韵酝蕴氲    时间: 2013-5-5 09:20
貌似官网提供的下载地址已经转到百度网盘了,这样就比115方便多了
作者: wangyanhan    时间: 2013-5-8 11:22
本帖最后由 wangyanhan 于 2013-5-8 11:25 编辑

《汉文博士》原本是个非常不错的辞书工具,“0.5.2.1470”版本后,却在原功能上添加了一个“转换异体字”工具,就仿佛衣着豪华的靓女穿上了一双旧鞋,极不相称,甚至有损原先形象呵呵!

1、下面是是“TextPro”的转换结果:


2、下面是“汉文博士”的转换结果:




作者: sanwsw    时间: 2013-5-9 09:52
繁简转换是一项及其复杂的工程,做这个软件之前,先得将学术界的研究成果融会贯通。
作者: wangyanhan    时间: 2013-5-10 11:17
“汉文博士0.5.3.1734“版里,又新增了一项——在释义栏选中任意一个汉字,便可在释义栏的下边沿显示那个字的繁简体及各种注音的新功能,非常实用、非常好呵呵!
作者: sanwsw    时间: 2013-5-10 22:08
这功能确实不错。这个版本还真不好找!
作者: wangyanhan    时间: 2013-5-17 22:36
今天放出的测试版”汉文博士0.5.3.1768“,更新了《简繁转换校正表》,能够正确地转换”台湾”和“古琴台“了呵呵!



作者: sanwsw    时间: 2013-5-20 12:18
本帖最后由 sanwsw 于 2013-5-21 19:26 编辑

台湾和台灣,两种观点一直在争论,都可以。

網絡文摘:
  台:天台(神話中的仙境,又地名)、天台縣、天台山、台州(浙江地名),三台星、台山(廣東地名),侗台語。音「(粵/北)怡」,姓氏:台元。

  臺:平臺、高臺、瞭望臺、舞臺、上臺、登臺、臺詞、月臺,天文臺、電臺,臺灣,一臺電視機(古時二字有別。今上述各詞,民間也習慣以「台」代「臺」)。臺鑒、臺端、兄臺(也有說來自「三台星」,故也寫作「台」)。宋王臺,姓氏:臺佟、臺號(上述各詞「臺」不可寫成「台」)。

  檯:桌子。

  颱:颱風。

作者: 醉蓉轩客    时间: 2013-5-22 14:33
0.5.3.1775 2013年5月22日
新增功能:
        词典编译器增加检查词条是否以标点符号结尾(检测不完整内容)的选项。
        简繁体、异体字转换。
        汉字文本排序。
        选中单个汉字时显示该汉字的简繁变体和读音。
        修改词条列表字体尺寸的选项。
        打开程序后马上显示启动界面,改善使用体验。
修改功能:
        程序自动检测基础数据库是否存在。
修复错误:
        在检字窗口复制的字体没有按显示顺序排序。

作者: wangyanhan    时间: 2013-5-22 18:03
本帖最后由 wangyanhan 于 2013-5-22 18:12 编辑
醉蓉轩客 发表于 2013-5-22 14:33
0.5.3.1775 2013年5月22日
新增功能:
        词典编译器增加检查词条是否以标点符号结尾(检测不完整内容)的选 ...
谢谢醉小姐告知,已下载使用了呵呵!

不知怎么的,“360杀毒”将上个测试版(0.5.3.1768)的主程序判为病毒,这次好了!^_^

另,在“汉文博士”重要的汉语辞书中,词条注音极少,唯《重编国语辞典修订本》注音准且全。可惜我们这些大陆人对注音不熟。前不久,我自制了一个《注音拼音对照字典》,用起来很方便,放出来共享。如果小姐需要的话请下载。

用这个《注音拼音对照字典》辅助阅读注音,我想久而久之,便可丢到这根拐杖了呵呵!





注音拼音对照字典.rar (9.21 KB, 下载次数: 637)

作者: 醉蓉轩客    时间: 2013-5-22 19:04
wangyanhan 发表于 2013-5-22 18:03
谢谢醉小姐告知,已下载使用了呵呵!

不知怎么的,“360杀毒”将上个测试版(0.5.3.1768)的主程序判为病 ...

感谢分享。不过最好还是能建议让汉文博士原生支持汉语拼音注音为好
作者: 醉蓉轩客    时间: 2013-5-24 18:25
又更新了,更新还挺频繁
0.5.3.1791 2013年5月24日
作者: wangyanhan    时间: 2013-6-4 20:37
本帖最后由 wangyanhan 于 2013-6-4 20:45 编辑

在本人即将出版的《中外历史豪华词库V2》中,增加了《文史名人名著词典》和《中国文化史词典》中的6000多词条,面对这些大量古汉语词条的多音字注音,幸亏有《汉文博士》助一臂之力——①检索快;②参看的辞书多……才使正音步伐大大加快了呵呵!
作者: renkai    时间: 2013-6-12 15:49
好东西。
作者: sanwsw    时间: 2013-6-30 14:34
最新版:汉文博士 V.0.5.3.1832
http://pan.baidu.com/share/link?shareid=369605&uk=3526745603
作者: wangyanhan    时间: 2013-6-30 16:01
本帖最后由 wangyanhan 于 2013-6-30 16:03 编辑
sanwsw 发表于 2013-6-30 14:34
最新版:汉文博士 V.0.5.3.1832
http://pan.baidu.com/share/link?shareid=369605&uk=3526745603

戴老师消息真灵通啊,我也是几乎天天都进汉文博士博客,就是没碰见更新呵呵!

“汉文博士.0.5.3.1832”又增加了一项新功能——能检测“运行环境”__ 显示 “ .NET Framework v2.0” 是否存在了!

记得前不久,我的一个加加坛友换系统后,忘了装 “ .NET Framework v2.0” ,双击 “汉文博士” 主程序后不能启动,还专门在国学数典发帖求助呵呵!


作者: sanwsw    时间: 2013-7-1 18:17
本帖最后由 sanwsw 于 2013-7-4 05:42 编辑

作者删除了最新的测试版。分享:

汉文博士之辞书、字表41种
http://pan.baidu.com/share/link?shareid=141522523&uk=4144280788


汉文博士 V.0.5.3.1832
http://pan.baidu.com/share/link?shareid=144919601&uk=4144280788
作者: wangyanhan    时间: 2013-7-15 10:40
7月13日,“ 汉文博士 ” 测试版已更新到 “ V0.5.3.1856 ” 。

新增功能——启动汉文博士后,首先出现的界面是 “每日一字” 。附文字: “每天多学一个字,我也能成汉字师” 。

不过愚见是:这个功能如能由用户自定义显示,那就更有实用价值了呵呵!已在国学数典提此建议。

作者: sanwsw    时间: 2013-11-29 21:24
V0.5.3.1944测试版
http://pan.baidu.com/share/link?shareid=369605&uk=3526745603
作者: wangyanhan    时间: 2013-11-29 22:56
下载看了一下,新增了一个——构形输入法支持区块筛选。觉得没多大作用呵呵!构形检索目的是查找生僻字,当然是韩信点兵多多益善,干啥要区块筛选啊?原先不是已经有了笔画、区块分类吗?

总之觉得左大师自0.5.3.1734版后,就没有实质性的新增功能和性能优化了,尽搞些花哨东西,譬如启动画面、每天一字啊等等。

所以,俺至今还是在用0.5.3.1734版……

作者: sanwsw    时间: 2014-3-17 21:38
0.5.3.2061 2014年3月17日
新增功能:
        更新统一码数据库为 6.3。
        增加汉字笔画数偏好选项。
        词典编译器增加检查词条是否以标点符号结尾(检测不完整内容)的选项。
        简繁体、异体字转换。
        汉字文本排序。
        选中单个汉字时显示该汉字的简繁变体和读音。
        修改词条列表字体尺寸的选项。
        打开程序后马上显示启动界面,改善使用体验。
        “每日一字”功能。
        构形输入法支持区块筛选。
        自动复制检索内容的选项。
修改功能:
        程序加载器检测 .NET Framework 2.0~4.0 是否安装。
        程序自动检测基础数据库是否存在。
        发行版中附带了汉字表。
        查询结果中的拼音字段使用拉丁字母显示,并生成音节检索超链接。
        查询结果中的粤拼字段生成音节检索超链接。
修复错误:
        在检字窗口复制的字体没有按显示顺序排序。
        未能正确加载默认值的问题。
        在输入文件包含很少词条的情况下,词典编译器会写入错误的词条索引,导致词条不在检索结果列表显示。

0.5.2.1470 2013年3月31日
新增功能:
        切换到主窗口后自动检索剪贴板内容的选项。
        单击词条列表检索词条的选项。
        构形检字功能将自定义常用部件表改成由统计构形数据库生成的构形部件表。
        构形检字功能可按笔画、直接构形字数排序构形部件表。
        词典编译器的“wordHeadIndicator”、“mergeAdjacentField”字段属性。
        词典编译器提示编译错误。
        词典编译器支持放置在 Zip 文件中的编译配置文件。
        词典编译器支持将兼容汉字和日文汉字转为正体汉字。
        调整正文背景色的选项。
        导出字库为图片的功能支持部分 OpenType 和点阵字体。
        主窗口增加前进按钮和词典数据库列表管理菜单。
修改功能:
        程序信息界面。
        基础数据库的异体字数据。
        自动模糊检索词条功能在输入两个汉字后开始自动检索。
        在词典配置界面中直接配置是否将词典用于模糊检索词条(适当禁用模糊检词可进一步提高检索速度)。
        自动安装词典数据库时,搜索“database”的下级目录。
        在配置文件中以相对目录路径记录保存在安装目录“database”目录内的词典,方便携带程序。
修复错误:
        在上一版本引入的构形检索漏检问题。
        导出字库为图片的工具没有记住选中的字体和字体尺寸。
        错误保存部首和构形检索的排序方式。
        无法显示检索结果的图片。
        词典编译器没有按照 HTML 规范读取 HTML 源文件。
        检索长词条时程序占用巨量内存的问题。

作者: wangyanhan    时间: 2014-3-18 07:59
sanwsw 发表于 2014-3-17 21:38
0.5.3.2061 2014年3月17日
新增功能:
        更新统一码数据库为 6.3。

这个测试版和前几款测试版相比,还有几项实质性改进呵呵!
作者: sanwsw    时间: 2014-3-31 19:32

汉文博士已更新到V0.5.3.2078

作者: wangyanhan    时间: 2014-3-31 21:26
sanwsw 发表于 2014-3-31 19:32
汉文博士已更新到V0.5.3.2078

上个版本是 “ 0.5.3.2061 ” ,投入使用后没几天,“ 360 防火墙 ” 就报毒了。俺这个人有洁癖,见报毒就心里不舒服,立即就卸了载。

换用这个 “ 0.5.3.2078 ” 的版本已经有好几天了,还没有出现报毒情况,看来这款还比较纯净呵呵!





欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2