华宇拼音输入法论坛

标题: ◇不当字频专帖 [打印本页]

作者: sanwsw    时间: 2010-1-2 10:18
标题: ◇不当字频专帖
不当字频专帖


  字频自动设定无法考虑多音字的因素,要想科学合理,必须辅以人工干预。字符集扩展、字音收录兼收并蓄,这给字频的科学设定带来巨大挑战。

  这里提出一个:chi:饰 



作者: sanwsw    时间: 2010-1-12 08:29
硃,虽非多音字,应该降频。
作者: sanwsw    时间: 2010-1-17 11:32
输入cong时出现“従”排第二,不当。【從】的日本本字。
作者: sanwsw    时间: 2010-1-23 13:54
标题: 有拼音,无法导入
第一个字有拼音,不知为何无法导入含有该字的词语?

作者: sunmd    时间: 2010-1-25 12:50
虛心接受意見,逐步修改完善。请发现类似问题的坛友多提字频建议。
作者: sanwsw    时间: 2010-1-28 12:03
涂的xú音,字频当降。

作者: sanwsw    时间: 2010-1-31 11:34
粘nián音的字频当降。
作者: sanwsw    时间: 2010-2-10 00:33
dī(dǐ)音的提、gu音的告,字频也须下调。
作者: sanwsw    时间: 2010-2-20 11:07
《现代汉语词典》已收“頫”之简体,奈何输入法还无法输出,致使“赵孟頫”这类简繁相间的此条出现。



[ 本帖最后由 sanwsw 于 2010-2-20 11:11 编辑 ]
作者: lionman    时间: 2010-2-20 14:58
s版的截图中的第一个词条是如何做出来的?
作者: 野风    时间: 2010-2-20 17:22
老戴,你这个字是怎么搞上去的?
作者: sanwsw    时间: 2010-2-20 18:38
自定义呗!
作者: 野风    时间: 2010-2-20 18:52
作为短语?
但你总要这个字被输入法认可吧?
作者: sanwsw    时间: 2010-3-6 12:39
係,字频当降。
銜,字频当降。
咋zha音,字频应降。

[ 本帖最后由 sanwsw 于 2010-3-6 17:16 编辑 ]
作者: sanwsw    时间: 2010-3-8 22:48
缪,miao音,字频应升。
哦,e音,应降频。

[ 本帖最后由 sanwsw 于 2010-3-9 00:15 编辑 ]
作者: sanwsw    时间: 2010-3-22 19:36
柚,zhóu音,当降频。
作者: 野风    时间: 2010-3-22 20:00
你什么时候变鲁迅了?
作者: sanwsw    时间: 2010-3-22 20:05
最近一直在寻找定位。
作者: sanwsw    时间: 2010-3-23 15:56
泛,feng
作者: pwyf6278    时间: 2010-4-5 13:40
紫光6.6的字频数据是根据什么统计得到的?很多字的字频很不准确啊
作者: 野风    时间: 2010-4-12 18:51
顶一下,希望在新版中,这些不当字频得以调整。
作者: sanwsw    时间: 2010-5-18 15:16
“饰”的不常见读音chì,字频很高。欠妥。
作者: sanwsw    时间: 2010-5-23 18:51
种音zhǒng、zhòng时,“种”不该出现在繁体集合中。
作者: sanwsw    时间: 2010-6-12 21:40
兹(cí),字频当降。
石(dàn),字频当降。

[ 本帖最后由 sanwsw 于 2010-6-12 21:47 编辑 ]
作者: vipou    时间: 2010-6-13 12:11
很多字都不认得,飘过。佩服楼主。
作者: sanwsw    时间: 2010-6-18 08:28
使用了6.7.0.9补丁。发现两台电脑上内码为8AAC的“説”字也被归到简体集合中。疑惑,请验证。
作者: sanwsw    时间: 2010-6-22 08:49
原帖由 sanwsw 于 2010-1-28 12:03 发表
涂的xú音,字频当降。

开发组疏忽了这个字吧?
不对。这个帖子所提的汉字字频,好像都没调整。(上面所述汉字字频均已调整!感觉没调整,是因为用户没删C:\Documents and Settings\当前用户\Application Data\unispim6下hzpy.dat——sanwsw


[ 本帖最后由 sanwsw 于 2010-6-22 21:33 编辑 ]
作者: 野风    时间: 2010-6-22 17:22
希望这个帖子能引起开发组重视……
作者: sanwsw    时间: 2010-7-10 17:42
2010年7月9日发布紫光华宇拼音输入法V6.7.0.24正式版。
字频不当:
ye音下:咽、荼
zhi音下:祗、衹
zhu音下:褚

[ 本帖最后由 sanwsw 于 2010-7-10 17:55 编辑 ]
作者: 野风    时间: 2010-7-14 07:19
支持一下!
作者: sanwsw    时间: 2010-7-31 17:38




[ 本帖最后由 sanwsw 于 2010-8-8 11:55 编辑 ]
作者: sanwsw    时间: 2010-8-9 22:27

作者: 野风    时间: 2010-8-10 07:22
可能是你用过这个字吧?
我是新装的系统,新装的输入法,没有恢复个人的字频和词频信息:

作者: sanwsw    时间: 2010-8-10 13:02
这字我是没用过的。与大家的字序不一样的现象出现多次了。我不知问题在哪。
明朝皇帝:朱祐樘(chēng),请为“樘”添加读音chēng,权威字典有这个读音。
作者: sanwsw    时间: 2010-8-10 22:51
𢛔(忄+柬):笔顺错误。
作者: q106106    时间: 2010-8-20 09:12
看来比较少见着一个字
作者: sanwsw    时间: 2010-8-30 08:14


作者: 野风    时间: 2010-9-18 06:43
支持一下!
作者: sanwsw    时间: 2010-9-30 16:21
向各位求证,你们是否也是如此?

作者: sanwsw    时间: 2010-10-10 23:47


三字属异体关系,《现代汉语词典》选用第二个字。大家该音的字序?
作者: 野风    时间: 2010-10-11 10:20

作者: sanwsw    时间: 2010-10-13 11:58

作者: 野风    时间: 2010-11-9 21:29
处理这些不当字频,还需花很大的功夫啊!
作者: 野风    时间: 2011-1-15 08:37
原帖由 sanwsw 于 2010-8-10 13:02 发表
这字我是没用过的。与大家的字序不一样的现象出现多次了。我不知问题在哪。
明朝皇帝:朱祐樘(chēng),请为“樘”添加读音chēng,权威字典有这个读音。


到目前为止,还没有添加这个读音!
作者: xml00    时间: 2011-1-15 11:07
小修小补不能从根本上解决问题。
系统解决问题的方法是,找到多音字合集,每个字按读音分配比例,再按读音比例分割每个字的字频。
如:阿a,0.787
       阿e,0.213
有了这个比例数据后,其他的问题都是小问题了。
作者: xml00    时间: 2011-1-15 11:12
关于低频字,如樘,两个读音可任意设一个为1,另一个为0,影响不大,因其字频很可能就是0。
扽这几个字,需要手工调整字序。
作者: sanwsw    时间: 2011-1-15 12:00
原帖由 xml00 于 2011-1-15 11:07 发表
小修小补不能从根本上解决问题。
系统解决问题的方法是,找到多音字合集,每个字按读音分配比例,再按读音比例分割每个字的字频。
如:阿a,0.787
       阿e,0.213
有了这个比例数据后,其他的问题都是小问题了 ...

这是解决问题的根本方向,不知开发组是否还有心思做这项工作。
作者: xml00    时间: 2011-2-12 18:00
http://bbs.jjol.cn/showthread.ph ... posted=1#post168416
唐纳之先生率先放出了多音字频比的资料,俺也放出俺的资料。
因为还不太完善,仅供参考!
资料在加加论坛,这里就不专门发帖了。
作者: sanwsw    时间: 2011-2-12 20:24
多谢徐先生热忱报告。
作者: 野风    时间: 2011-5-7 12:01
原帖由 xml00 于 2011-2-12 18:00 发表
http://bbs.jjol.cn/showthread.php?p=168416&posted=1#post168416
唐纳之先生率先放出了多音字频比的资料,俺也放出俺的资料。
因为还不太完善,仅供参考!
资料在加加论坛,这里就不专门发帖了。


希望在新版开发时,开发组能参考这个资料!
作者: sanwsw    时间: 2011-5-9 11:32
希望开发组看到并收藏这些资料。
作者: sanwsw    时间: 2011-5-15 09:24
坐,查《汉语大字典》和汉典论坛,都只有zuò音。紫光华宇拼音输入法还有chuài这一个读音。查汉字属性,chuài时的字频极低。

这倒不奇怪,更奇的是智能组词“*chuai”时,总出来“X坐”。
作者: ljdqe    时间: 2011-5-15 10:50
原帖由 sanwsw 于 2011-5-15 09:24 发表
坐,查《汉语大字典》和汉典论坛,都只有zuò音。紫光华宇拼音输入法还有chuài这一个读音。查汉字属性,chuài时的字频极低。

这倒不奇怪,更奇的是智能组词“*chuai”时,总出来“X坐”。


^_^果然很蹊跷啊
作者: 野风    时间: 2011-6-21 07:06
可能是一个bug




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2