华宇拼音输入法论坛

标题: v6.6官方发布词[附录最新简繁体字频修正版6.6.0.32] [打印本页]

作者: 京城秀水    时间: 2009-12-29 10:46
标题: v6.6官方发布词[附录最新简繁体字频修正版6.6.0.32]
=============================================================================================================================
谢谢大家对紫光华宇拼音输入法的一贯的支持与厚爱。v6.6正式版经过近半年多的“打磨”,终于快要和大家见面了。中间经历了多次推迟发布的情况,跟大家说说声抱歉。
v6.6是今年发布的几个版本中变动最大的,希望大家能够喜欢,并继续关注和支持紫光拼音的发展。
v6.6版本中吸取了大量网友的非常宝贵的建议,但由于各种原因的限制,不能对网友的所有意见都一一修改。
任何一个版本都不可能是完美的,任何一个版本的发布,都会有人说喜欢,有人会发牢骚,这些正面、反面的意见是我们开发下一个版本的动力。
提前预祝各位坛友新年快乐。
                                                        by.sunmd
=============================================================================================================================
紫光华宇拼音输入法v6.6岁末重装出击
自1999年诞生至今,紫光华宇拼音输入法已与您携手走过了十个年头。十年磨一剑,“紫光拼音”更像一个图腾,在一代人心中留下了难以磨灭的美好印记。
十年以来,紫光华宇拼音输入法团队不断致力于为您打造更快捷,更易用,更强大,更时尚的拼音输入法,为您的中文录入提供更贴心的服务。
2009年底,凛冽的冬日中,正值十周岁生日之际,睽违近半载的紫光华宇拼音输入法v6.6温暖发布。
v6.6秉承十年积淀,锐意进取,全面支持Unicode所有汉字录入,增加拆字输入工具,支持英文联想输入与即时翻译,增加自定义短语管理功能……所有的改进必将助您在工作学习生活中运指如飞,如虎添翼。
在新的一年里,紫光华宇拼音输入法愿伴您“虎虎”生风!
祝您新年快乐,“六六”大顺!

【v6.6版本更新说明】
1、全面支持Unicode,75000汉字轻松输入,简繁体及非中文操作系统均可安装使用
2、增加拆字输入
3、支持英文联想输入与即时翻译
4、支持网址直接输入、网址自动补全及网址提示
5、提供网址管理工具,自定义网址可关联至网址补全与网址同步
6、汉字管理实现拼音、笔画、部首、编码、拆分检字功能
7、支持自定义短语外挂
8、i、I模式:全新设计,可快捷输入数字/日期/时间/单位
9、u:直接输入操作命令,并提供u模式上下文提示开关项
10、增加笔画辅助输入,并支持通配符*
11、优化设置面板设计
12、修改Bug:解决状态条残留、词库清零等问题

                                                           by.京城秀水
=======================================================================
今天用了一天的時間修複簡繁、字頻的問題,更新爲v6.6.0.32,暫時在此貼中發布。請關注此問題的各位網友幫忙測試一下。如果問題不大,明天在各個網站進行同步更新。     by.sunmd
=============================================================================================================================
为了让大家能够用上满意的版本,开发组的朋友们的努力是大家有目共睹的.开发组忙了一天,又忙着发布了这个简繁体字频修正版,请大家抓紧时间测试,有问题就回在此贴后吧.  [超版权限限制不能编辑孙老师的帖子,就综合到这个贴了]   by.fengyu29
=============================================================================================================================

unispim6.6.0.32.zip

19.13 MB, 下载次数: 5583


作者: michsun    时间: 2009-12-29 13:30
搞不懂,有些人打不出这个字那个字的时候要说这个不好那个没有。

现在人家弄了个全的又说没必要那么多,只要能用就可以了。

那到底是多好还是少好?

紫光99年诞生,我第一台机器是99年2月买进,几乎是和紫光同步过了这么些年。除非今后真的是触摸的时代,不然紫光依旧是最喜欢的输入法……
作者: vszhw    时间: 2009-12-29 14:50
还是有很多人打不出某个字时就会抱怨输入法的,不全也不行啊
作者: lummar    时间: 2009-12-29 15:53
还是那个老话,众口难调啊
作者: shardineblog    时间: 2009-12-29 17:04
众口难调。。。恭喜紫光。。。
作者: 永远的紫光    时间: 2009-12-29 17:10
紫光十年!·
作者: 一箭冲天    时间: 2009-12-29 19:09
没有十全十美的输入法,愿紫光做得更好!!
作者: ccyes    时间: 2009-12-29 19:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: fengyu29    时间: 2009-12-29 19:20
我综合了一下,编辑发布到了京城秀水的这个帖子里了.超版权限不够,没法编辑sunmd老师的帖子.^_^
作者: 野风    时间: 2009-12-29 19:23
字频的问题因不明白就里故不发表言论,输入法本身没有任何问题。
作者: sanwsw    时间: 2009-12-29 19:24
祝贺。又要覆盖安装了。痛快并快乐着。
作者: 还是支持紫光    时间: 2009-12-29 19:42
来支持了。
记得以前打个“囧”字还得切换到繁体,如果是那样,我宁愿在简体模式下保留这小部分的“繁体字”,只要字频OK就行
作者: HESHILIE    时间: 2009-12-29 19:58
呵呵,出来了,我就要支持的呀!!!
作者: krsun    时间: 2009-12-29 20:18
来晚了,正在下载.^_^
作者: kork2006    时间: 2009-12-29 20:31
等待v6.6正式版的绿色版
作者: kingwoto    时间: 2009-12-29 20:41
我支持 感谢紫光
作者: kingwoto    时间: 2009-12-29 20:42
好心人 是否可以分流一下,我现在的速度是1K啊
作者: mmm    时间: 2009-12-29 21:12
七万五千只是个概数,不宜用阿拉伯数字表达。
另外对于简体集合的修改矫枉过正了。把“軆”、“礼”等古字、俗字剥离简体集合情有可原,但是连“飝”也去除就不对了。“飝”没有简化字,《简化字总表》点明“飞”不是一个可用于类推简化的部件。现在的做法等于收了“兒”的简化字“儿”,就把“倪”归为繁体字了。
作者: sanwsw    时间: 2009-12-29 21:13
原帖由 kork2006 于 2009-12-29 20:31 发表
等待v6.6正式版的绿色版

http://www.greendown.cn/soft/13495.html
虽没号称是正式版,但已非常接近正式版。
作者: cunqiu    时间: 2009-12-29 21:22
这么快就6.6.0.32了,顶一下。
作者: stwcb2007    时间: 2009-12-29 21:33
支持一下
目前的绿色版还不够绿
希望有类似拼音加加的便携版
这才是真正的绿色版
默默期待o(∩_∩)o...哈哈!!!
作者: sunmd    时间: 2009-12-29 21:40
原帖由 mmm 于 2009-12-29 21:12 发表
七万五千只是个概数,不宜用阿拉伯数字表达。
另外对于简体集合的修改矫枉过正了。把“軆”、“礼”等古字、俗字剥离简体集合情有可原,但是连“飝”也去除就不对了。“飝”没有简化字,《简化字总表》点明“飞”不 ...

具体的数字是75475,在汉字管理程序中能看到具体的数字。
“飝”定义为大字符集中的数据了,在简体、繁体中都无法输出,除非使用大字符集输入。类似的一系列汉字,很少使用,在一些资料中查看定为“义未详”的都归为此列。
作者: lg3417    时间: 2009-12-29 22:56
正式版刚刚出,就又出修正版了,看了还要等一下,再安装了:)。
作者: vszhw    时间: 2009-12-29 23:06
omg,修正版这么快就推出了,我该说什么好呢。
作者: ljdqe    时间: 2009-12-29 23:13
动作真的很快啊
赞一个
作者: 龙城水秀    时间: 2009-12-29 23:30
恭喜新版发布!真的很让人惊喜
作者: sunmd    时间: 2009-12-30 09:12
我总感觉我们坛子中有火药味。有问题尽量提,别有针对性,大家都是为了紫光拼音好。
作者: sunmd    时间: 2009-12-30 09:21
原帖由 332211 于 2009-12-30 09:12 发表

问题是现在字体集合的定义很值得仔细斟酌,本人认为很不妥当,这也是造成该问题的原因所在。“飝”字应该出现在“大字符集”(若确定是“飞”的繁体的话,就不该至于该集合中)与“繁体”字符集中,而将其排斥在“ ...

你更新最新的v6.6.0.32版本了么?
(1)“飞”简体
(2)“飛”是飞对应的繁体
(3)“飝”这个字定为非简非繁,即只有切换到大字符集时才能打出来。应该属于极不常用的字。

还想听听332211的关于v6.6.0.32更多的意见。
作者: michsun    时间: 2009-12-30 09:25
麻烦搞清楚“有些人”和“有的人”的区别~

同时追求所有不是不好,而是有没有必要。外加所有这个概念究竟是多少,有没有界限。
同时即使有了所有,是不是就都可以用到了,如果是,那么100MB,1T体积的紫光我也下了用。但如果没有必要,要1T的紫光有何意义。

搞清楚,我是搞不清楚,因为汉字太多,常用也就2、3K。外加我个人是没什么文化,认识字不多,没事还要查查字典,用用紫光的那个“偏旁部首检字”。可能您比较有学识,还望今后多多为紫光出谋划策,早日发布1T的紫光输入法。

没办法,习惯就是不好,太啰唆。后面来什么都不会了,免得搞乱了32的发布~
作者: PreZident    时间: 2009-12-30 10:25
原帖由 332211 于 2009-12-30 10:12 发表
我刚才覆盖安装6.6.0.32版,初步试了试,说点看法,以供参考:
1、紫光拼音输入法过于谦虚了,每次安装之后总是默认排位在输入法的最后一位,这个没必要。我每次安装了紫光后都需要手工调整到首位,也是比较麻烦的。

是说搜狗和 QQ 吧,其实搜狗也挺流氓,也是把自己尽可能排第一,而且自己提供的输入法管理器允许删除一切输入法,就是自己不删除。
不过最流氓的是,发现了QQ比它流氓,于是就变身为被流氓欺负了,找法院说理去了…………不得不佩服他们炒作的本领,说不定是唱双簧,吸引眼球也未可知。
人至贱,则无敌。不服不行。

又习惯性地跑题了。回归正题。我认识一些海外朋友,他们的工作需要使用繁体,但是发现几种输入法的繁体准确性不是很高,很容易有错别字。比如搜狗的繁体心臟,好像会变成 髒(记不清了,随便举了例子)。
我推荐了紫光,因为我试了他们说的几个例子,好像没有出现错别字。但是朋友觉得还是有问题。
所以我觉得如果能在这方面提高,并宣传一下,可能会更受繁体人士的欢迎。
作者: togra    时间: 2009-12-30 10:40
看看是不是完美了,永远支持紫光!
作者: sunmd    时间: 2009-12-30 11:14
谢谢332211给出的测试,我们已经修改,会推出一个版本v6.6.0.34,但由于类似的错误还会存在,我们现在数据处理方式还有点原始,只能逐步接近于完美,不可能在短期内达到完美。所以计划将修改后的v6.6.0.34作为正式版发布了。
作者: ZXD4G    时间: 2009-12-30 11:28
332211元老确实是个细心、耐心的人,咱很认同,也稍有区别:
1.简体字的目标是要排除明确的繁体字和异体字,以及字词典中查到的“日本用简体汉字”、“日本用汉字”、“日本和字”、“韩文吏读字”等,典型的简繁还好办一些,最麻烦的异体字的认定,好些字词典中的凡例、解释和文字使用现状冲突,不同的来源也有冲突(A说某字是正体,其它为异体,B说得和A相反或不全相同)。处理这些矛盾的时候,参考了BIG5字符集的收字情况,依据是“BIG5为港台通行交流途径,它不收编的字,其异体的成分更大一些”。
2.繁体字的目标也不是弄成一个大杂烩,而是要考虑“现在通行或活跃”这个原则,一些上面帖子中提到的“古同xx”之类的,也不大想置入这个集合,它们将非简非繁,只有在大字符集中才能输入;“大字符集”这个概念被拓展了,原来是GBK的21003字,现在是CJK的75000多字,目前有拼音的是26000多字,因多音字之故,汉字拼音条目为接近32000。
3.简繁设定的时候,尽可能依据充分,一些眼下未能判定的,处于“亦简亦繁”状态,等待继续审订完成后,争取准确定性。

言不尽意之处,待发布后(仍会有瑕疵,但应该没有太大的问题了)继续沟通。
作者: shardineblog    时间: 2009-12-30 11:42
确实很难。。。
作者: krsun    时间: 2009-12-30 12:06
鑫字被归为了繁体
应该是传承字吧
作者: sanwsw    时间: 2009-12-30 12:15
原帖由 krsun 于 2009-12-30 12:06 发表
字被归为了繁体
应该是传承字吧

果然在简体模式下找不到!另,“欣”仅归入简体集合也欠妥。

[ 本帖最后由 sanwsw 于 2009-12-30 12:18 编辑 ]
作者: ZXD4G    时间: 2009-12-30 12:19
已经修正“鑫”,不算这个,和.31相比,另有133个字的属性修订。
“欣”也改了,BIG5集合的13000多字至少具有“繁体”属性。

[ 本帖最后由 ZXD4G 于 2009-12-30 12:22 编辑 ]
作者: sunmd    时间: 2009-12-30 15:20
原帖由 ZXD4G 于 2009-12-30 12:19 发表
已经修正“鑫”,不算这个,和.31相比,另有133个字的属性修订。
“欣”也改了,BIG5集合的13000多字至少具有“繁体”属性。

应该说和.32相比有133个属性修订,和.31相比就更多了。
作者: wqpn    时间: 2009-12-30 16:21
file:///C:/Documents%20and%20Settings/Administrator/桌面修正版6.6.0.32在不装“大字符集”的情况下已经感觉到完美了(我个人的感觉)在候选字里边不但没有混杂繁体更没有了天窗问题,天窗是出现在偏旁部首查字里边。

[ 本帖最后由 wqpn 于 2009-12-30 16:23 编辑 ]
作者: kingdick    时间: 2009-12-30 17:30
原帖由 332211 于 2009-12-30 17:21 发表
对于不明白是属于“简”还是“繁”的,请百度一下,这不难呀!



百度很多东西不是标准。
作者: kingdick    时间: 2009-12-30 18:12
火星文输入法是一个外挂插件,能将任何输入法输入的正常文字变成那些奇奇怪怪的字,所以跟任何一个输入法都没有关系,要怪就怪那个“火星文输入法”~~


提供资料一说,官方的人早就要你的邮箱了,好像一直没有得逞
作者: fengyu29    时间: 2009-12-30 18:26
332211已经是论坛元老级别了.真的是好快啊.感谢你对华宇拼音的持续关注和大量的良好建议!!!
作者: mmm    时间: 2009-12-30 18:36
原帖由 sunmd 于 2009-12-29 21:40 发表

在一些资料中查看定为“义未详”的都归 ...
这个原则不错。
作者: mmm    时间: 2009-12-30 18:42
原帖由 332211 于 2009-12-30 10:50 发表
听说过“百寿图”么?每个“寿”字都写法不同,异体字而已,都纳入“简”体字符集中吗?
龙有几种写法、虎有几种写法、福有几种写法、……,中国的异体字多了,类似于问错别字有多少?能说得清楚么?数不胜数哇!! ...
如果Unicode有百种“寿”字,只怕你要把它们都归到“繁体”。问题是大陆用户日常不用这些字,难道港台用户日常就用这些字吗?你想“净化”简体和大字符集,却把繁体集合当大杂烩。
作者: mmm    时间: 2009-12-30 18:50
原帖由 332211 于 2009-12-30 17:55 发表
都是现状“无所不能”的输入法给整出的“好事”,看看吧:
要不细看,还以为是洋鬼子的帖子呢!但其实不过是假洋鬼子的帖子哦。
这些东西早在紫光输入法改名“紫光华宇”前就有了。术业有专攻,有折腾“火星文”的,也有像紫光华宇这样认真处理汉字的(无论所处理的字是日常生活中的还是故纸堆里的)。
作者: mmm    时间: 2009-12-30 18:52
原帖由 kingdick 于 2009-12-30 17:30 发表



百度很多东西不是标准。
岂止百度不足为训,金山、汉典、叶典都只能参考,因为它们取材良莠不齐。
作者: mmm    时间: 2009-12-30 18:58
原帖由 332211 于 2009-12-30 10:16 发表
奨——这个应归为繁体。
那就违背了你在36楼对“繁体”的定义。“奨”大陆不用,在港台也不是“正体字”。
作者: mmm    时间: 2009-12-30 19:03
原帖由 332211 于 2009-12-30 09:12 发表

“飝”字应该出现在“大字符集”(若确定是“飞”的繁体的话,就不该至于该集合中)与“繁体”字符集中,而将其排斥在“繁体”字符集显然是不合适的,应该修正。
这个字没有繁简的问题,要么简体、繁体同时收,要么同时不收。仅仅因为“飛”有简化字就把“飝”归入繁体,那“漂”“倪”“鑫”“瞻”都要排除在简体之外了。
作者: Nore    时间: 2009-12-30 20:21
终于出正式版了,不求字库有多大,但求速度快,用着稳定
作者: krsun    时间: 2009-12-30 22:28
理解楼主
作者: mmm    时间: 2009-12-31 20:26
原帖由 332211 于 2009-12-31 19:03 发表
呵呵,还是以你的判断逻辑来掌你自己的嘴吧!
你连百度、金山词霸、汉典、新华字典、……都不认为有权威性了,仅可作为供参考,怎么单就这个“奨”字你就敢如此武断地说在台湾、香港、海外都不用呢?你比起国内的所有字典都要权威吗?你的依据是什么?那你认为在大陆用吗?你认为是中国字吗?都不用的话,那究竟是谁用的呢?是杜撰出来的吗?你的话就比国内所有的字典都更具有“权威性”吗?恐怕除了你的盲目自信以及IQ<30的之外,没有人会相信你的判断是正确的哦。


一、我没说过《新华字典》不具权威性。
原帖由 mmm 于 2009-12-30 18:52 发表
岂止百度不足为训,金山、汉典、叶典都只能参考

二、大陆权威字典没有免费的在线版,台湾有。你可以去查《国语小字典》http://dict.mini.moe.edu.tw/cgi-bin/gdic/gsweb.cgi?o=ddictionary,看看以何为正。
三、我没提过“海外”。
原帖由 mmm 于 2009-12-30 18:58 发表
那就违背了你在36楼对“繁体”的定义。“奨”大陆不用,在港台也不是“正体字”。

不过,日语倒是以“奨”为正。http://www.bunka.go.jp/kokugo/main.asp?fl=show&id=1000003885&clc=1000000068&cmc=1000003929&cli=1000002682&cmi=1000003875
四、“奨”当然是“中国字”。《汉语大字典》:

作者: mmm    时间: 2009-12-31 20:32
原帖由 332211 于 2009-12-31 19:12 发表
欲加之罪,何患无辞。
我说过吗?我表示过要将寿字的其它写法统统都归入繁体么?
你要驳别人的观点,你就该先弄清楚别人的观点是什么,仔细看看前面的帖子,好好领会一下我的本意,然后再来争论,别乱弹琴,好不好?我这要求不高吧?

http://bbs.unispim.com/viewthread.php?tid=8352
原帖由 332211 于 2009-12-28 21:46 发表
而“繁体”字则包括了所有除了简体字之外的所有汉字。

本主题
原帖由 332211 于 2009-12-30 10:12 发表
至于“繁”这个字符集就该包括所有的汉字去除明显的“简”体字即可。

作者: ZXD4G    时间: 2009-12-31 22:44
没有敢说网上的资料不权威,但咱真的没有见过哪一个特权威,在一些有争议的字儿上,多种来源的资料就存在矛盾,取舍颇费精神,结果也同样不敢称特权威。个人感觉,《现代汉语词典》、《新华字典》、《汉语大词典》的可靠性要高于词霸、汉典,还要考虑BIG5字符集这个繁体界的重要参考。
例如:“么”的繁体究竟是“麽”呢?还是“麼”呢?根据《汉语大词典》的凡例和字义,前者为正体,后者为异体,但前者不在BIG5中,意即港台人士用的是后者,至少电子化的文字表述是这样。
这个现象给繁体属性的设定造成了一些困扰,涉及到繁体字的目标,究竟是面向古代典籍的文字研究呢?还是照顾当今大陆与港台交流呢?我们的想法是活跃者优先,也就是满足现代繁体交流。

另外,.38版比.35还增加了一个类推简化字(U+2AA17——&#174615;——jue1),这个字是在审订“屩”的简繁时,翻阅《现代汉语词典》2002年版时看来的,请注意,新加的这个字隶属于unicode CJK Ext-C(U+2A700~U+2B734),这表达了一个趋势,即现代汉语词典已经超越了传统的GB2312,乃至GBK,也就暗示我们,不能再把GB2312当简体了;又闻通用规范汉字表之七八千字,也会有大量的GBK外的字儿,诸君作何猜想?

最后,今天手查《现代汉语词典》,颇感效率低下,对于校正大量字条,很是艰难,哪位仁兄有电子版的,可否厚赠?2005版更好,纯文本格式更好。
作者: krsun    时间: 2009-12-31 23:42
四哥,有时间收邮件。
作者: mmm    时间: 2010-1-4 21:13
原帖由 332211 于 2009-12-31 21:50 发表
在中国汉字一般都默认归类为简体与繁体两类,这你该知道吧?在人们的观念中并没有既不属于简体又不属于繁体的汉字吧?有吗?如有的话,称其为什么呢?真是在这个意义上才有上面的说法,这你也奇怪?你没有在大陆生活过?不明白麽?

原帖由 332211 于 2009-12-31 21:59 发表
汉字非简体即繁体,这是大家所默认的。至少大陆都如此默认了,至于异体字咱没有研究过港台是如何处理的,是承认呢还是一概不承认。因此对繁体的处理咱并没有多少涉及,主要就简体这个字符集说事。由于这里分三个字符集,就该优化设置,至于繁体集合,就算是混杂若干字也无大碍,毕竟这个是主要是为大陆用户设计使用的,不是特意为港台设计的,有啥可大惊小怪的呢?

原帖由 332211 于 2009-12-31 22:02 发表
简体、繁体原本都是中国文字,只是大陆现状的使用简体字,而港台才使用繁体字,中国大陆用简体字,余下的放入繁体集合中有何不可?也值得那个mmm大动干戈来兴师问罪么?


不要妄议别人,也别去代表别人。“默认归类为简体与繁体两类”、“没有既不属于简体又不属于繁体的汉字”、“汉字非简体即繁体”可能只是你的观点。试问“紫光”二字是简体还是繁体?
汉字并不能依繁简划分为两类,未被简化的传承字两岸都在用。另外,大陆用的不叫“简体字”,而叫“简化字”。(“侭”是“儘”的简体字,而《简化字总表》“儘”和“盡”合并简化为“尽”。)大陆用的也不仅仅是简化字,还有传承字(不然,“紫光”两个字你也别打了),两者合起来,大体就是IT界创造的“简体中文”这一术语所涵盖的汉字范围。
既然做了繁体模式,当然要做好。港台怎么处理你没研究过就别说“余下的放入繁体集合”这种话。




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2