华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 27487|回复: 31
打印 上一主题 下一主题

简体集合中的冷僻字

[复制链接]
跳转到指定楼层
1
发表于 2010-1-2 09:26:37 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
简体集合中的冷僻字

  1.简体集合中出现某个简体字相对应的繁体字不应该。332211网友的这点意见非常正确,开发组已经听取,并在继续努力。
  
  2.简体集合、繁体集合、超大字符集,字频要合理,要基本符合拟用对用的汉字使用习惯。332211网友的这个意见也正确,开发组也在努力,尚需时日。
  
  3几个问题:
  ①简体集合中要不要收录生僻字?
  关键看这些冷僻字有无需要。古籍数字化过程中,每个汉字都有输入的可能。因此,简体集合中收录冷僻字自然有必要。
  
  ②简体集合中收录生僻字以多少为好?
  这是可以讨论的学术问题,近日很多人在提意见,版主群中讨论也非常热烈,许多网友参与讨论,发来邮件。有多人提到取《新华字典》、《现代汉语词典》的字头字与征求意见稿《通用规范汉字表》、《现代汉语通用字表》 的并集,再适当收录其他人名、地名冷僻字、网络热字。这个问题还可继续商讨。
  
  ③现行简体集合是完全错误吗?
  现行简体集合=全字集-简体字对应的繁体字(或异体字)。简体集合应是为大陆人士服务的,窃以为这个集合如此处理的原则方向毫无问题。中国汉字异体字现象非常严重,完全按台湾的异体字字典处理,工作量十分巨大。个人认为根据第一批异体字整理表剔除异体字,基本可以了;332211认为现行简体集合的收字数量和收字范围完全错误。不是说他这一观点激怒某人或开发组,而是他提意见非常武断,将个人体验替换成大家的感受,他说据他了解,许多人转用2.3版。
  凭我了解,使用2.3版者,绝大部分是不知道紫光最近几年发展变化者,少部分因操作系统原因无法使用最新版。用了6.5版而改用2.3版者肯定有,但必是极少数。我相信332211不大可能使用2.3版的!
  
  ④输入中冷僻字跑到前边很烦很不爽,咋办?
  332211说到有意无意中输入冷僻字,结果冷僻字高踞候选序列前边很不爽。这是问题。我们分析原因并提出解决方案。
  a.闲了没事,输入冷僻字干吗?不去摆弄那些冷僻字,自然不会跑到前边来。至于字频不当,没输过就高踞前边位置,这才是真正的问题,需要各位提出意见,需要开发组继续调整。
  b.因需要输入冷僻字,可见现行简体集合收录冷僻字有必要。既要输入,又不让它跑到前边,要么固频,要么慢速调频。这个矛盾很难平衡。当然通过“汉字管理”工具复制查到的冷僻字,也行!!!但一般人不会如此处理。
  c.采用固顶字方案。本坛已有每音8个字(如果该音字数足够多的话)固顶字方案可用下载(智能ABC的字序)


[ 本帖最后由 sanwsw 于 2010-1-2 16:15 编辑 ]
2
发表于 2010-1-2 09:29:10 | 只看该作者
好帖!
3
发表于 2010-1-2 09:38:45 | 只看该作者
原帖由 sanwsw 于 2010-1-2 09:26 发表
简体集合中的冷僻字
  1.简体集合中出现某个简体字相对应的繁体字不应该。332211网友的这点意见非常正确,开发组已经听取,并在继续努力。
  
  2.简体集合、繁体集合、超大字符集,字频要合理,要基本符合 ...

为紫光管理人员不厌其烦的解决某一问题的态度叫好。 顶起来。
4
发表于 2010-1-2 09:49:05 | 只看该作者
好帖
软件安装的时候默认超大字符集就可以了
有特殊需要的毕竟少数
自己调整设置就可以了
5
发表于 2010-1-2 10:11:45 | 只看该作者
戴版所言极是。对于简体字库,简繁是要分清,而冷僻字也是一定要收的,只要字频控制好就是了。
6
发表于 2010-1-2 15:25:39 | 只看该作者
楼主 sanwsw 版的观点希望开发人员能真正理解。繁简终于可以分开了?大字符集的繁简分开了?说通还真不容易。冷僻字是应该有,但·如何划分?字频是万能的?常用字和已经死掉的字分开坚决不行?谁需要那些已经死掉的字,到大字符集里去找好了。
尽管有以上不同看法,其实不是最重要的。重要的是,围绕语句智能,及单字输入能力,开发相应的服务功能,让输入法入门容易、效率高效。就算是即将出现“7.0将是改变输入法历史的一个版本”,我想也离不开这个主题,即使是“脑电波输入法”在紫光这里诞生。
冒昧问下,紫光7.0遇到单字怎么办?
7
发表于 2010-1-2 15:30:33 | 只看该作者
楼主的这个帖子就对了,支持先
8
发表于 2010-1-2 15:49:08 | 只看该作者
正解在楼下,大家请无视此处,
万一不小心输入了冷僻字,又看它不顺眼的话,
可以注销后把用户词库文件user.uwl删掉,最后再次注销即可

位置去这里看,紫光用户目录就是了
http://bbs.unispim.com/viewthread.php?tid=8412&extra=page%3D1

[ 本帖最后由 vszhw 于 2010-1-2 16:20 编辑 ]
9
 楼主| 发表于 2010-1-2 16:13:07 | 只看该作者
楼上的不对。user.uwl是用户词库,包括新造的,可能包括智能组词。单字输入而输入冷僻字,不会记录到user.uwl。若是设为单字快速或者慢速调频,C:\Documents and Settings\用户名\Application Data\unispim6\zi\hz_cache.dat才是记录字频。将其删除则可。

[ 本帖最后由 sanwsw 于 2010-1-2 16:25 编辑 ]
10
发表于 2010-1-2 16:17:32 | 只看该作者
原帖由 sanwsw 于 2010-1-2 16:13 发表
楼上的不对。user.uwl是用户词库,包括新造的,可能包括智能组词。单字输入而输入冷僻字,不会记录到user.uwl。若是设为单字快速或者慢速调频,当前用户wordlib文件夹下的ci_cache.dat才是记录词频。将其删除则可。

学习了,由于之前删除的是文件夹,之后改为固定字频词频,没有再次验证,汗一个,希望没有害到无辜群众
11
 楼主| 发表于 2010-1-2 16:25:09 | 只看该作者
现在简体集合、繁体集合和超大字符集要不要收录CJK扩展集中的汉字(基本与冷僻字等义),与文字输入中偶尔输入冷僻字却高踞榜首是完全不同的两个问题,希望不要混淆。前者是简体集合中要不要收录收录CJK扩展集中汉字问题,后者是偶尔输入冷僻字后如何让它快速下降问题。
12
发表于 2010-1-2 16:52:53 | 只看该作者
删hz_cache.dat的方法并不方便,难道要普通用户都备好一个删除它的批处理文件,每次用完生僻字就执行一次?至于固定字频,也对很多人不适用。

还是建议把ctrl+数字的快捷键,在对词起“删”的作用的基础上,加入对字的“复位”作用。
例如一个生僻字,在没有用户字频记录时原始排在第5页,用过以后排到了第1页,此时在第1页按ctrl+该字对应的序号,则该字将回到第5页的原来位置上

[ 本帖最后由 还是支持紫光 于 2010-1-2 16:59 编辑 ]
13
发表于 2010-1-2 17:10:33 | 只看该作者
ctrl+数字的快捷键,在对词起“删”的作用的基础上,加入对字的“复位”作用。


好主意!赞!
14
 楼主| 发表于 2010-1-2 17:15:37 | 只看该作者
原帖由 还是支持紫光 于 2010-1-2 16:52 发表
删hz_cache.dat的方法并不方便,难道要普通用户都备好一个删除它的批处理文件,每次用完生僻字就执行一次?至于固定字频,也对很多人不适用。

还是建议把ctrl+数字的快捷键,在对词起“删”的作用的基础上,加入对 ...

删除hz_cache.dat的方法并不可取,并不方便,但并未建议普通普通用户如此处理,仅是对我楼上一个回帖的提醒。发帖、回帖可要注意语境。
这段时间关于简体集合、繁体集合和超大字符集的争论,争出了一个冷僻字输入后该字升降的问题,很有意思,开发组可以借此展开技术攻关。
15
发表于 2010-1-2 17:33:40 | 只看该作者
原帖由 柴子 于 2010-1-2 17:10 发表


好主意!赞!

然后我发现QQ3.0就是这么处理的。。。希望紫光也能加入

wo.jpg (8.08 KB, 下载次数: 145)

wo.jpg
16
发表于 2010-1-2 17:37:23 | 只看该作者
原帖由 sanwsw 于 2010-1-2 17:15 发表

删除hz_cache.dat的方法并不可取,并不方便,但并未建议普通普通用户如此处理,仅是对我楼上一个回帖的提醒。发帖、回帖可要注意语境。
这段时间关于简体集合、繁体集合和超大字符集的争论,争出了一个冷僻字输入 ...

知道的啦,我只是说那样做虽然可以实现,但并不可取,还是得用其他方式妥善处理。官方不妨考虑一下QQ的处理方法?
17
发表于 2010-1-2 18:39:39 | 只看该作者
楼主所言甚是,强烈支持!!!
18
发表于 2010-1-2 19:07:06 | 只看该作者
原帖由 sanwsw 于 2010-1-2 17:15 发表

删除hz_cache.dat的方法并不可取,并不方便,但并未建议普通普通用户如此处理,仅是对我楼上一个回帖的提醒。发帖、回帖可要注意语境。
这段时间关于简体集合、繁体集合和超大字符集的争论,争出了一个冷僻字输入 ...

有人喜欢快速字词频调整,这样冷僻字就很容易跑到前面,尽管这辈子这个字也就用这一次。这样的字占据了前面的位置,多数人都会感到不爽的。既然是冷僻字,词频一定是排在后面的,要打出这个字是不是还要翻页?翻页找到这个字打出自然要调频了。以词定字也许能找到这个字,可以避免这个字调频,但没有这个字的组词呢?如果有(直接)辅助码,这个问题就迎刃而解了——不仅仅可以不用翻页就快速确定这个字,这样打出的字还不参与调频。自然码、拼音加加就是这样处理的。
据说紫光7.0很强,类似这样处理的合理方式一定要赶上或者超过。

[ 本帖最后由 平庸※迷茫 于 2010-1-2 19:10 编辑 ]
19
发表于 2010-1-2 19:10:02 | 只看该作者
原帖由 平庸※迷茫 于 2010-1-2 19:07 发表

有人喜欢快速字词频调整,这样冷僻字就很容易跑到前面,尽管这辈子这个字也就用这一次。这样的字占据了前面的位置,多数人都会感到不爽的。既然是冷僻字,词频一定是排在后面的,要打出这个字是不是还要翻页?翻页 ...

我想问问,你既然只是不小心用那么一两次这些冷僻字,那么它的字频应该还是相对你经常使用的简体字也是很低的吧,那么它上来之后,你一段时间别管它,多用其它的简体字,这个冷僻字应该很快就会退到后面去吧?
20
发表于 2010-1-2 19:13:03 | 只看该作者
原帖由 Secask 于 2010-1-2 19:10 发表

我想问问,你既然只是不小心用那么一两次这些冷僻字,那么它的字频应该还是相对你经常使用的简体字也是很低的吧,那么它上来之后,你一段时间别管它,多用其它的简体字,这个冷僻字应该很快就会退到后面去吧?

当然这样可以,但问题是许多人不喜欢它这样在前面存在一段时间
21
发表于 2010-1-2 19:14:26 | 只看该作者
原帖由 平庸※迷茫 于 2010-1-2 19:13 发表

当然这样可以,但问题是许多人不喜欢它这样在前面存在一段时间



这是怪人吧,那么多人是怪人??有洁癖症的??
22
发表于 2010-1-2 19:17:51 | 只看该作者
原帖由 Secask 于 2010-1-2 19:14 发表



这是怪人吧,那么多人是怪人??有洁癖症的??

如果你熟悉这样打字了,说不定也会成为“洁癖”的
23
发表于 2010-1-2 19:24:28 | 只看该作者
其实我没有站在自己的角度说话。不管用什么拼音输入法,我字词频都是固定的,遇到需要调整的,都是手动调频,不存在冷僻字跑到前面的问题。
对了,紫光字词频固定后怎样手动调频?
24
发表于 2010-1-2 19:24:41 | 只看该作者
原帖由 平庸※迷茫 于 2010-1-2 19:17 发表

如果你熟悉这样打字了,说不定也会成为“洁癖”的

我不会,我用了紫光足足6年了,基本上每天都在用紫光打字,误按“冷僻字”的事情时有发生,但这有什么好不爽的呢?不就是偶然见到几个你平常不认识的字嘛~~~~
25
 楼主| 发表于 2010-1-2 19:30:15 | 只看该作者
原帖由 平庸※迷茫 于 2010-1-2 19:24 发表
其实我没有站在自己的角度说话。不管用什么拼音输入法,我字词频都是固定的,遇到需要调整的,都是手动调频,不存在冷僻字跑到前面的问题。
对了,紫光字词频固定后怎样手动调频?

字频固定后,通过汉字管理工具调频。词语固频后,还无法手动调频,除非修改系统词库词频。
26
发表于 2010-1-2 19:38:10 | 只看该作者
原帖由 sanwsw 于 2010-1-2 19:30 发表

字频固定后,通过汉字管理工具调频。词语固频后,还无法手动调频,除非修改系统词库词频。

哦,管理工具,字频调整。。有点麻烦啊。
词频还不能调整。。
最好是在输入面板候选字词中能使用快捷键。
27
发表于 2010-12-17 11:22:58 | 只看该作者
“頠” 所有的输入法只有繁体字,没有简体字我兒子的名字有个“頠”,这个字在字典中右半边的“页”是简体字,户口簿上也是简体字,但所有的输入法都只能打出繁体字,公安建议我把儿子名字直接改成繁体字,但他的毕业证上都是手写的名字是简体字,改了很麻烦。将来他要乘机如果打不出简体字也很麻烦,请求高人指点,或者紫光能加这个字。谢谢

这个字为什么有繁体字,却没有简体字呢。郁闷
28
 楼主| 发表于 2010-12-17 17:41:20 | 只看该作者
原帖由 zhangjunlvshizz 于 2010-12-17 11:22 发表
“頠” 所有的输入法只有繁体字,没有简体字我兒子的名字有个“頠”,这个字在字典中右半边的“页”是简体字,户口簿上也是简体字,但所有的输入法都只能打出繁体字,公安建议我把儿子名字直接改成繁体字,但他的毕业证上都是手写的名字是简体字,改了很麻烦。将来他要乘机如果打不出简体字也很麻烦,请求高人指点,或者紫光能加这个字。谢谢

这个字为什么有繁体字,却没有简体字呢。郁闷


听从公安人员建议,身份证、户口簿及学校档案内用名直接改为“頠”,一了百了。一定要输出这个字也是有办法的,但是银行、机场处,可能无法检索。

方法:
①安装国际标准超大字符集字体支持包Unifonts6.0(http://okuc.net/software/UniFonts6.0.exe),重启。

②使用紫光华宇拼音输入法输入这个字,参看http://www.yedict.com/content.asp?word=E6A0


29
发表于 2010-12-17 22:45:19 | 只看该作者
顶12/13楼
30
发表于 2010-12-20 15:16:04 | 只看该作者

回复 28楼 的帖子

大侠
我用的就是,但是在字海里只能打出“頠”打不出你的那个图,麻烦告诉我怎么弄奈。
还有如果装了国际标准超大字符集字体支持包Unifonts6.0,打出呢这个字的简体字,在其他电脑上能识别出来吗
谢谢

[ 本帖最后由 zhangjunlvshizz 于 2010-12-20 15:28 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-26 20:03

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表