华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 61246|回复: 21

【汉语大字典(第二版)最新pdf及检索表】附件已更新

[复制链接]
发表于 2013-11-25 11:58:10 | 显示全部楼层 |阅读模式
本帖最后由 wangyanhan 于 2013-12-26 23:43 编辑


【汉语大字典(第二版)最新pdf及检索表】附件已更新


    华宇论坛可是个宝藏多多的所在啊!昨天,sanwsw戴老师上传了一个1G多的“汉语大字典(第2版,硬盘检索版).rar”。今天,俺再上传一个456MB的“汉语大字典(第二版)最新pdf”及相关的“汉语大字典(第二版)检索表”呵呵!

◆汉语大字典(第二版)最新pdf:
    1、“汉语大字典(第二版)最新pdf”由寒月斋主人制作。
    2012年9月5日,寒月斋主人发布了第一个汉语大字典(第二版)的pdf版。2013年4月17日重新上传的,是“汉语大字典(第二版)最新pdf版”。
    2、最新pdf版质量上大有提高,主要表现是可以复制大部分的释文内容。
    3、下载页面:(百度云)  
http://pan.baidu.com/share/link?shareid=421217&uk=3341444204
汉语大字典(第二版)2013.04.17.pdf
    4、在pdf电子书中,有详细的“部首检字”、“笔画检字表”和“音序检字表”。见下图:
汉语大字典第二版封面及pdf标签.png
    5、文件大小:456MB。

◆《汉语大字典(第二版)检索txt》:
    1、本检索参照紫雪蓝海的“汉语大字典第二版检索表exce”制作。
    紫雪蓝海的“汉语大字典第二版检索表exce”下载页:(百度云)
http://pan.baidu.com/share/link?shareid=860093773&uk=2066787853&third=2
    汉语大字典第二版检索表 by紫雪蓝海(tsiank).xlsx
    2、紫雪蓝海本人说明(2013-6-15):
    本人上月23号发贴,希望大家共同完成汉语大字典第二版检索表的制作,可是应者寥寥,于是就自己一人动手,以第一版的检字表为基础,以几乎每天两百页的速度,逐页校对每个字头,于今天,刚刚终于算是基本完成了第二版检索表的制作。等我再稍加整理一下,就发出来。希望大家能一起继续完善它。
    3、《汉语大字典(第二版)》共收录单字60370个,紫雪蓝海编制的“检索表.xlsx”已实录汉字55643个,还有4727个汉字未录,尚待进一步完善。现将未录汉字用“*X”替代着字头,并附有“页码”和“本页第x字”,用户根据需用可自行进行补充。
    4、本《检索》虽不是完整版,但本人在实用中已感觉到十分方便了呵呵!

◆《汉语大字典(第二版)检索txt》使用说明:
    以检索“*漢”字为例:
    1、在文本编辑器的查找栏,输入“*漢”,即可查出“页码_1836”。
    2、把“1836”拷贝到“汉语大字典(第二版)”pdf阅读器状态栏的页码栏里,回车,即可跳转到“漢”字所在的1836页。见下图:
“漢”字页面.png
    3、这次下载的“汉语大字典(第二版).pdf”,为寒月斋主人于4月17日重新上传的电子书,文件大小456MB。新上传的“汉语大字典(第二版).pdf”,比原djvu版在复制的准确性上大有提高。下面是“漢”字的复制文本摘录:

《 説文》 :“ 漢, 逯也, 東為滄浪水。从水, 難省聲。 減,  
古文。”
(―〉 卜加《廣韻》呼旰切,去翰曉。 元部。
0水名。 汉水,一名“ 汉江” , 长江最长的支流。 源出陕西
省西南部宁强县, 流经陕西省、 湖北省, 在武汉市入长
江。《 説文丨水部》 :“ 蓮,篷也, 東為滄浪水。” 朱駿聲通訓
定聲域中大水也。出今陕西漢中府寧羌州北皤冢山為
蓮, 至南鄭縣西為漢, 今名東漢水, 東流至湖北襄陽府均
州名搶浪之水, 又東南流至漢陽府漢陽縣漢口合江。”

◆汉文博士词典:《汉语大字典二版检索》
    凡使用过“汉文博士”的网友们都知道,“汉文博士”是一款数据库容量大,有“拼音、部首、构形”等检索的工具书软件。在上述《汉语大字典(第二版)检索txt》的基础上,本人又制作了“汉文博士词典:《汉语大字典二版检索》”。

    ★使用举例:检索《汉语大字典》中的“𨨸”字:
    1、用汉文博士的构形检索检索出“𨨸”字。见下图:
构形检索.png
    2、用汉文博士的“汉语大字典二版检索”,检索出“𨨸”字的页面。见下图:
检索字的页面.png
    3、把“4561”拷贝到pdf阅读器状态栏的页码栏里,回车,即可跳转到“𨨸”字所在的页面。见下图:
汉语大字典中的字.png
    4、下面是“𨨸”字的复制文本摘录:   
步 虫 响 叩 《集韻》 眉耕切,平庚明。
0 同“镰”。 销。《玉 篇’金部》 鏟, 銷也。 ”《集韻, 庚
韻》 鐘, 銷也。或省。”
珍削。《篇海類編丨珍寶類, 金部》 鏟, 鏟削也。 ”《字彙’  
金部》 鏟,削也。”

◆附件下载:

汉语大字典(第二版)检索txt_直接用.zip (509.22 KB, 下载次数: 7750)
 楼主| 发表于 2013-11-25 12:40:07 | 显示全部楼层
本来想在上个帖子的《汉语大字典(第二版)检索txt》一节,插入一个《汉语大字典(第二版)检索txt》文件的预览图,可论坛提示:“……无法提交……”
TT截图未命名.jpg
没办法,就只好另发新帖,补上这个预览图了呵呵!
《汉语大字典(第二版)检索txt》.png
发表于 2013-11-25 18:46:02 | 显示全部楼层
去換新版漢大嘍,之前那個pdf用的就不錯

点评

很喜欢看这个头像——饱含才女气质呵呵!  发表于 2013-12-9 15:03
头像被屏蔽
发表于 2013-11-26 23:03:24 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2013-11-27 12:24:07 | 显示全部楼层
本打算把紫雪蓝海没弄的那4000多个缺字慢慢补齐,谁知刚一动手就碰到了大困难——

——天哪!几乎全是Unicode超大字符集中也没有的字呵呵!

发表于 2013-11-29 15:54:13 | 显示全部楼层
楼主能否把汉语大字典第二版的全部【字头】用word或excel或txt文本发布一下?——字头后面附上Unicode码。(Unicode码没有的字可以空缺)。
 楼主| 发表于 2013-11-29 16:28:34 | 显示全部楼层
本帖最后由 wangyanhan 于 2013-11-29 16:33 编辑
jarenwen 发表于 2013-11-29 15:54
楼主能否把汉语大字典第二版的全部【字头】用word或excel或txt文本发布一下?——字头后面附上Unicode码。( ...
谢谢jarenwen网友的关注,对你的提问作如下答复:

(一)俺本帖的txt和汉文博士词典的《汉语大字典(第二版)检索》,就是参照 “紫雪蓝海的“汉语大字典第二版检索表exce” 制作的。” 紫雪蓝海的“汉语大字典第二版检索表exce ” 的下载网页(百度云):
http://pan.baidu.com/share/link?shareid=860093773&uk=2066787853&third=2
该电子表格用 “Microsoft Office 2007” 可以打开。

(二)给字头添加Unicode码的操作并不难,用正则替换就可以解决。关键问题是,目前在俺的手头上,只有 “ Ext、Ext-A、Ext-B ” 的编码资料,尚缺“Ext-C”之后的编码资料,这就是几千编码的空缺啊!

(三)建议jarenwen网友下载使用汉文博士,用这款软件,可以快速检索全部CJK字符集的编码。当然,汉文博士的功能远远不止这一点点呵呵!

(四)最后补充一点,后来俺才发现—— “紫雪蓝海的“汉语大字典第二版检索表exce” 中的4千多字空缺,其实绝大部分是Unicode超大字符集中没有的字符。

点评

哦,明白。我有一提议,先生能否根据你的字典,把汉语大字典第二版中的异体字整理出来(做个txt文件),好像这个工作还没有人做——在异体字后面附上正体(通行)字。  发表于 2013-11-29 16:56
发表于 2013-11-29 17:00:57 | 显示全部楼层
本帖最后由 jarenwen 于 2013-11-29 17:07 编辑

刚下载了先生一楼提供的检索表(txt),发现才60232字,汉语大字典是60370字,还138字呢?
 楼主| 发表于 2013-11-29 19:03:15 | 显示全部楼层
本帖最后由 wangyanhan 于 2013-11-29 19:16 编辑
jarenwen 发表于 2013-11-29 17:00
刚下载了先生一楼提供的检索表(txt),发现才60232字,汉语大字典是60370字,还138字呢?


(一)
“汉语大字典第二版检索.txt”中的最后一个字,就是“汉语大字典(第二版)最新pdf”(寒月斋主人制作)的最后一个字。不知原因何在呵呵!见下图:
汉语大字典最后一页.png

汉语大字典第二版检索.txt.png

(二)
关于字典、词典类数据的工作,早有权威机构做了,就不需要鄙人班门弄斧了呵呵!
在俺的上个回帖里,不是建议jarenwen网友下载使用汉文博士吗?请看汉文博士中的“Unihan”中的数据:
汉文博士.png

说明:“Unihan”中汉语大字典的数据,是第一版(八卷本)的数据。俺现在的,是第二版(九卷本)的数据。

在汉文博士左侧边字典栏,提供了每一个汉字的详细编码:
汉字编码.png

点评

1、虽然字典txt最后一字是字典pdf最后一字,但中间肯定漏掉了某些汉字,不知先生能否用你的汉文博士数据导出一个更完善的txt字表来?2、如果能有个像字典第一版附录后面那样的异体字附表,能够一目了然就更好了。  发表于 2013-11-30 11:04
 楼主| 发表于 2013-12-26 23:30:44 | 显示全部楼层
Andrew 发表于 2013-12-26 16:57
王兄好,刚用汉语大字典硬盘检索版查一个字(亻與),这个字念yu3,在265页第12字,而检索链接是错误的,搞 ...

谢谢Andrew网友的使用及指正!

1、①原【㒜】字,序号_2648,无此字,现已删除该行。②原【X】字,序号_2602,实为【㒜】字,现已更正。并将“2648”之后的序号,作了全部调整。

2、现已发布 “ 汉语大字典(第二版)检索txt_更新二版.zip ” 和 “ 汉语大字典第二版检索汉博词典_更新二版.zip ”,请仍在一楼下载更新呵呵!

 楼主| 发表于 2013-12-27 00:23:53 | 显示全部楼层
Andrew 发表于 2013-12-27 00:00
谢谢王兄给我们提供的方便,修订版已下载。另sanwsw兄制作的汉语大字典(第2版,硬盘检索版)
http://bbs. ...


Andrew兄是这样的——

“汉语大字典(第二版)最新pdf”电子书的制作者,在制作该pdf电子书时,将封面、编辑人员、说明、前言、凡例、后记等页面都全部调到了pdf电子书的最后面,这样,pdf阅读器的实际页码,就与汉语大字典(第二版)正文的实际页码一致了,这就非常方便检索。

不知戴老师“硬盘检索版”的检索信息,是不是源于紫雪蓝海的Excel资料,如果是,也应该存在同样的错误。但俺不会摆弄那个“硬盘检索版”,就无力相助了呵呵!
发表于 2013-12-27 08:13:42 | 显示全部楼层
本帖最后由 sanwsw 于 2021-11-14 20:15 编辑

  《汉语大字典》第二版,来自数典论坛,原称浏览器检索版,实际使用方法与《汉语大字典》第一版之DVD光碟版一样。因为将整部字典数据储存到硬盘上,我称它为硬盘版。

  汉语大字典[第二版,硬盘检索版]
链接: https://pan.baidu.com/s/1-110G6BaZTXiJh4o07G6zw 提取码: ef5n


  汉语大字典[第二版,硬盘检索版]字头文件更新,全面校补位于CJK-ExtC、D、E、F区块汉字,下载、解压,覆盖原文件即可。
链接: https://pan.baidu.com/s/1V_3UyccAbUJVSr3OvoHfTQ 提取码: m978

 楼主| 发表于 2013-12-27 08:56:58 | 显示全部楼层
sanwsw 发表于 2013-12-27 08:13
  《汉语大字典》第二版,来自数典论坛,原称浏览器检索版,实际使用方法与《汉语大字典》第一版之DVD光碟 ...

戴老师是这样的,俺又重新仔细的看了11楼Andrew网友的帖子,才明了原来那个链接错误,是首先在戴老师的硬盘版上发现的。这说明,硬盘版的链接也是参照紫雪蓝海的Excel资料制作的。

可惜俺不会摆弄这个硬盘版,对修改事宜就无能为力了呵呵!
发表于 2013-12-27 09:37:54 | 显示全部楼层
㒜(?亻與)字,在《汉语大字典》第二版之硬盘检索版中能顺利检索。不过这个版本的字头检索,也曾发现个别字检索页码错误。
发表于 2013-12-27 11:38:24 | 显示全部楼层
经核查,《汉语大字典》第二版收录,而硬盘版(浏览器网页检索版)无法检索的汉字有4441个。估计这4441个汉字属于非Unicode汉字。另外有“乾、倫、軛”三字无法检索,估计是字头检索目录编制错误。
发表于 2013-12-27 22:07:04 | 显示全部楼层
本帖最后由 sanwsw 于 2014-8-21 16:04 编辑

硬盘版,使用文本编辑器打开data-sorted.js,即可依样画葫芦修改页码、页内次序错误。

已修改了上述各楼发现的4个汉字的页码错误,下载、解压并覆盖同名文件,即可找到这个4个字。

data-sorted.js 4月21日更新版: data-sorted.js.rar (354.92 KB, 下载次数: 2096)

点评

佩服戴老师的钻研精神 ^_^ !俺一见是个1G 的庞然大物,没有下载使用,所以就不会摆弄呵呵!  发表于 2013-12-27 22:31
发表于 2014-8-20 22:15:17 | 显示全部楼层
本帖最后由 sanwsw 于 2014-8-21 16:02 编辑
汉语大字典(第二版)检字表说明
作者:tsiank
邮箱:tsiank@qq.com
1.本检字表以第一版字表为基础,经与第二版逐页对照,调整次序,增加字数,将每页的第一个字头及最后一个字头标注页码,而后在EmEditor中利用正则表达式形成每个字头的页码,在excel中利用计算重复次数的Countif函数生成每个字头的页内次序,从而完成本表的制作,除下文提到的那11个字外,应该包括了第一版字表上的所有字。
2.按汉语大字典(第二版)所言,本版共收字60370个,可是我所整理出来的字头共有60232个,比所说的少了138个,可能是由于我赶进度以及疏忽,把这138个字漏掉了。
3.在这60232个字头中,用五笔打不出来的共有4590个(我用的五笔码表收录了CJK基本及CJK-A、CJK-B、CJK-C、CJK-D区中的全部字,也就是包括了目前所有已编码的汉字)。我说的打不出,指的是我自己打不出来,应该一部分是拆码错误,另一部分是目前的Unicode标准确实尚未收录该字,CJK-E、CJK-F发布后估计会补充一部分。
4.我把这4590个字头分为两部分:异体替代字头(149字)和待定字头(4441字)。前者指该字头虽然打不出来,但可以找到该字头的异体字,于是用异体字加中括号来代替该字头;后者指导该字头打不出来,也未找到异体字,于是用字母X来表示。
5.在这60232个字头之外,尚有第一版收录的11个字头在第二版中我自己找不到任何对应字头。这11个字头为:……
6.有的字头后跟的小括号里面的字为该字的简体字,有的字头后跟的中括号里面的字为该字在第一版中的异体字(由于新旧字形的关系,第一版中新旧字形同收的字比如“併”和“倂”,在第二版中已经合而为一,只收新字形,不收旧字形。这类字大多是以幷或幵作部件的字)。有的字头后跟的大括号里面的字为该字的类推简化字,这些类推简化字第二版不一定收录。
7.表中跨页1、跨页2、跨页3表示连续这几页都有该字头的义项。这个我主要是想把汉语大字典做成mdict格式的电子词典而用的。
8.该字表目前并不是太完善,但日常查询使用应该基本上不成问题了。只是希望发出来以后大家能一起校对完善它。如果大家在使用过程中发现了错误,找到了所漏的字,打出了我没有打出的字,希望都能够在此提出来以便共同更新。
■第二次更新:
本次更新,修正了几十处字头与页码对应错误的问题,增加了一百多个原先没有打出的字头,这些大部分是由extc先生发现并增补的。另外,异体字替换成网上得到的汉语大字典(第一版)异体字,这个异体字表由DAUFU先生发布。excel检索表内的四千多个待定字头增加了由extc先生提供的字体图片以供参考。目前检索表中字头共计60336个,与前言声称的60370个相比尚缺34个,如果大家在使用过程中发现缺失的字头以及其他错误,请在此反馈或者发邮件给我。
■第三次更新(2014年4月15日):
修正错误,增加字头,目前检索表中字头共计60367个,与前言声称的60370个相比尚缺3个!

 根据4月15日更新的字头检索表,依样画葫芦制作了data-sorted.js。下载覆盖同名文件即可。

   data-sorted.js.rar (354.92 KB, 下载次数: 2047)
 楼主| 发表于 2014-8-20 23:30:08 | 显示全部楼层
本帖最后由 wangyanhan 于 2014-8-20 23:33 编辑
sanwsw 发表于 2014-8-20 22:15
  根据4月15日更新的字头检索表,依样画葫芦制作了data-sorted.js。下载覆盖同名文件即可。
戴老师:

2014年6月15日,俺已经在紫光论坛另发了一个帖子,是根据紫雪蓝海2014年4月15日的“汉语大字典第二版检索表exce”制作的《汉语大字典第二版检索》txt和汉文博士词典。请参看:

http://bbs.unispim.com/forum.php?mod=viewthread&tid=31827&extra=

“《汉语大字典第二版检索》TXT、汉文博士词典更新版”

不过没有您介绍的这么详细,也没有 “ data-sorted.js ” 检索呵呵!
发表于 2021-11-14 20:17:30 | 显示全部楼层
汉语大字典[第二版,硬盘检索版]字头文件更新,全面校补位于CJK-ExtC、D、E、F区块汉字,下载、解压,覆盖原文件即可。

下载见第12楼。http://bbs.pinyin.thunisoft.com/forum.php?mod=redirect&goto=findpost&ptid=31606&pid=119917&fromuid=17977
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2022-10-8 02:49

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表