华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 13261|回复: 2
打印 上一主题 下一主题

关于V6.1的字序问题及纠正措施

[复制链接]
跳转到指定楼层
1
发表于 2008-3-6 12:19:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
在V6.1中,我犯了一个严重的错误,导致有些字序忽然显得离谱,如ni中首页出现“儿呢”,kuai中“会”字当头等,原因如下:
1) 主要原因——V6.1增加了一些字的读音(如:“洞”之tong2音,用于“洪洞县”;“匼”之an3音,用于成语“阿匼取容”;“间”之gan1音," 界“之ga4音,用于xml00先生校订的成语”半间不界“、”不间不界“、”半间半界“,等等),导致原来未标注为多音字的,一下子变成多音字了,而为一个多音字的不同拼音分配相应比例的字频时用到的对照表没有更新,于是,新变成多音字的,其罕用拼音下的字频,也等同于完整的字频,在候选框中,它就靠前了;
2) 次要原因——V6.1的字频全面采用中文分词之后再统计频度的方案,这种方案的思路或趋向是:单字字频不严格按照使用绝对频度来设置,还要看看它究竟是怎样一种用法,是单用机会多呢?还是主要用在一些词中,对于主要用在词中的字,大可不必让它列选得太靠前,应该是一种带有尝试性的改良方案。这么统计下来,由于好多字的使用频度计数归到了由它构成的词的头上,字频的具体数值就比6.0的设置得低。

如上一增一减,格外显得某些字的罕用音突兀在前;目前,字序已经重新纠正,在360安全卫士之装机必备软件中提供的版本已经体现,以后再发布的更新或者新版也将OK。

在论坛中,提出这个质疑的有一个帖子,咱躲闪着没有立刻释明,一是基于以下几个原因,感觉到单字的影响不是那么大,二是担心一旦说得透彻了,反而好的意图达不到,却遭致不可预料的负面影响。无论如何,为此遭受困惑的朋友,还是可以对咱进行批判,咱们能做的就是坚持勇于承认错误,更要及时地承认错误。
1) 单字输入的场合少——词库丰富了,整句输入能力提高了,一定要进行单字输入的机会确实降低了;
2) 固顶字的应用——不少用户使用固顶字,并且固顶得很多,相当于字序是自我掌控的,没有受到冲击;
3) 曾经输入过的单字优先,这些缓存数据在6.0到6.1的升级过程中会顺利继承,受到的冲击被缓解。
2
发表于 2008-3-6 12:26:22 | 只看该作者
感谢四哥的坦诚!其实这个问题也不是什么大的问题!呵呵!
3
发表于 2008-3-6 13:04:47 | 只看该作者
左总看看我对固顶字设置的一些想法,不知道是否容易实现。另外还有其它的一些建议希望可以抽时间看看。
http://bbs.unispim.com/viewthrea ... p;extra=&page=1
(2)改善固顶字的设置
①可以指定固顶字在候选栏中的固定序号,这样可以与音调结合便于记忆。其它未指定序号的位置则由系统按照字频自动分配。(我在论坛上发了一个根据音调顺序设置固顶字的帖子,由于紫光不能直接指定固顶字的顺序,所以产生了许多用不上的生僻字凑数)
例如:
you=1忧2由3有4又6优7游8友9右
或者
you=2由3有4又9右

②可以指定默认空格上屏的字(或快速调频时用户刚刚输入的字)在候选栏中出现的位置,并且这个位置的字同样可以通过空格输入。其它字频的字在剔除了用户设置的固顶字后在候选栏的空余位置从左到右根据字频高低顺序排列。
例如:
考虑到输入的方便可以将【1】【2】【3】【4】对应于音调的1234声,【6】【7】【8】【9】也对应于音调的1234声,此时设置【5】为最高字频位置。这样最多可以设置1个字音的4个声调所对应的8个字。【1】【2】【3】【4】
键相对比较好按,可以将比较常用的字设置到他们上面。如果固顶字需要用到【6】【7】【8】【9】键,则候选栏的候选字词数需要设置为9

③固顶字设置允许有重复字,这样可以方便拼音相同音调不同的多音字设置。
例如:
wei=1微2为3委4为6威7维8伪9未

wei=2为4为9未

④当用户想要的字不在第一页按TAB扩展显示时,第一行不再根据固顶字设置的顺序显示,而是根据系统的字频顺序显示。

⑤每个用户对固顶字的需求与设置不同,希望紫光可以提供一个平台,以便用户灵活设置。这个平台就是固顶字设置中可以指定其在候选栏中的序号、可以指定首选字在候选栏中的位置、固顶字可以有重复字。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 12:25

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表