华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 21799|回复: 11
打印 上一主题 下一主题

用回紫光,给四哥的建议。

[复制链接]
跳转到指定楼层
1
发表于 2008-7-27 17:17:45 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
记得刚刚用非系统自带的输入法的时候,就是用搜狗和紫光两家。但是后来因为各种原因,把紫光卸载了没有用了,用搜狗、qq、加加三家。
刚刚出来的新版紫光试用以后感觉很不错,智能性有了提高,速度也很快。加上解决了单字辅助码的挂接,我已经正式用回了紫光,现在基本上可以说把qq要淘汰一段时间了。用了几天以后,根据自己的感受给开发组提几个建议。
一、智能化水平还有上升的空间
用了最新版紫光的感觉就是智能化水平有所提高,赞歌我就不多唱了。就说说紫光还有那些提升的空间。
看了四哥的测试很强大,但是我感觉测试的重点在于正规语言和书面语言。这些语言的正确率当然重要,但是就普通用户而言,口语的成功率才是关键。开发组以后的重点应该在这个方面。我喜欢用举例来说明问题(当然几个句子不能证明什么,但是我要说明问题必须要举例子)我说的都是常用的口语。
如:我没有你那么贪心-----紫光的结果是:我没有你那么谈心。加了25兆语料库以后正确了。这个句子应该很常用的,而且还是比较规范的。

如:你说的不清不楚(的---这个字可以加,也可以不加)----紫光的结果是:你说的不清不出。加了25兆语料库无效,加了50兆语料库,还是无效。这句也是很常用和规范的口语吧。
上面两个句子搜狗、加加、qq都是正确的。当然几个句子不能说明全部问题,比如搜狗也会有“打字通缉”这样让人啼笑皆非的组词。我的总体感觉这次紫光新版的智能性已经超过了qq1.3版和加加5.0版。但是在口语上(因为我不可能去测试书面语言)感觉还是搜狗强一些,可能是我的打字习惯是短语、短句、词组多,而长句很少吧。
来紫光论坛知道四哥是专注紫光的智能改善,个人觉得紫光在口语智能的提高上面还有上升空间,希望继续努力。
嗯,对了还有就是搜狗在短语上的优势也可以学习,短语和短句的区别应该就是把长句断开打。搜狗断句后的准确率值得称道。
我曾经在qq拼音内部群举例子说明qq在断句后准确率的差距。
如:现在还是以同情为主-----搜狗和qq都正确。如果断开打:现在还是///以同情为主。qq的后半句就成了:一同情为主。
我也拿紫光举个例子:你貌似没说话-----搜狗和紫光的智能组词都正确。但是有的词组派可能不习惯打那么长,当然也不想打单字。断开打:你貌似///没说话。
搜狗出来的是“你貌似”可以直接上屏,加加出来的是“你冒死”不是我要的,但正确。紫光出来的是“你茅斯”(加25兆语料库无效,加50兆语料库就是“你貌似”了)……这个恐怕说不过去吧。

二、关于用户词库参与智能组词的问题。
个人觉得如果一个输入法的智能核能够处理好词性、介宾关系、词频。那么我双手赞成用户词库参与智能组词。但是现在所谓的用户词库参与组词只是依赖词频吧。就是以算法高明而著称的谷歌,也不能处理好介宾关系。
所以就我接触的加加和狂拼用户来说都有说用了一段时间觉得智能下降的,当然狂拼正式版说增加一个“记忆优化”(这个词紫光也组错了,用25兆语料库)功能解决这个问题,不知道效果如何。
某人喜欢自造“刘华德”“周驰星”来智能组句,以此来证明这个输入法的智能水平,我看紫光开发组千万别上他的当,坚持自己的想法。当这类人用自造了“姜琳”来组句“我想把这个东西快递给姜琳”来嘲笑紫光和搜狗组成“我想把这个东西快递给降临”的时候,就会同时面对“好运怎么样才能姜琳”这样的可笑句子。
本来字词派嘲笑智能的最大缺点是什么?确定性差,现在这种依赖词频的用户词库参与组词就是增加智能的不确定性,难道可取吗?如果这样能行的话,qq早就做了,因为内部群里面总有人提出来,qq的官方的回答总是正在考虑,不过要慎重。
就目前而言,紫光倒是可以学学qq的半开放,就是在无重码的情况下,让用户词库参与组词,有重码的情况下让位系统词库。

三、辅助码的问题
紫光没有辅助码一直是被人诟病的问题,紫光开发组几个月前就说要有,结果这次的新版本还是没有。
紫光的用户不同于加加的用户,基本上都是普通用户,可能对辅助码要求不是很高。
除了学习搜狗、加加的tap键间接部首和笔画辅助码可以借鉴外,还可以借鉴加加的“67890”五笔画笔画直接辅助码,本来加加也是借鉴了智能abc的八笔形辅助码,大家都是借鉴。我想这种辅助码对于普通用户来说易学易用,很不错。
另外就是紫光有声调辅助,但是使用起来非常麻烦。对于双拼用户来说可不可以学习新华拼音的声调直接辅助码呢?开发组的人可以下载新华拼音试试就知道了。


以上观点仅供参考,呵呵

[ 本帖最后由 岳家军 于 2008-7-27 19:54 编辑 ]
12
发表于 2008-7-28 17:56:36 | 只看该作者
原帖由 岳家军 于 2008-7-28 16:15 发表

版主大人可能搞错了,我说的就是用12345选字,而用67890加辅助码。
当然了,可能开始不习惯,但是总比没有辅助码强吧

呵呵!不好意思,没理解透彻!抱歉!抱歉!建议设置个选项,选择是否开启辅助码为好!
11
 楼主| 发表于 2008-7-28 16:15:09 | 只看该作者
原帖由 野风 于 2008-7-28 12:03 发表


不好意思!大作昨天就已经拜读过了!但因标题是给四哥的,也就没有发表什么意见!现在谈一下看法:写得很不错!意见很中肯!
另:我是全拼用户,若用6789选字,感到会很别扭,建议开设相应的选项!

版主大人可能搞错了,我说的就是用12345选字,而用67890加辅助码。
当然了,可能开始不习惯,但是总比没有辅助码强吧
10
发表于 2008-7-28 12:44:47 | 只看该作者
又见高手过招!!!
得此类用户,紫光幸矣
9
发表于 2008-7-28 12:03:34 | 只看该作者
原帖由 岳家军 于 2008-7-27 22:58 发表
怎么没有见野风版主发表意见,起码应该对智能化水平的提高说说看法。转告一下四哥。


不好意思!大作昨天就已经拜读过了!但因标题是给四哥的,也就没有发表什么意见!现在谈一下看法:写得很不错!意见很中肯!
另:我是全拼用户,若用6789选字,感到会很别扭,建议开设相应的选项!

8
 楼主| 发表于 2008-7-28 10:36:41 | 只看该作者
原帖由 ZXD4G 于 2008-7-28 10:01 发表
收到,感谢楼主的建议,欢迎回归。

诚如斯言,无论在智能组句方面,还是在排除重码方面,抑或是便捷性方面,紫光华宇都存在改进的必要性和可能性,我们会持续努力。

需要说明一下的是顶帖中提到提高智能性,从 ...

多谢四哥回复。
其实我说得也是四哥这个意思,虽然我对输入法智能内部的问题还不是很了解,但是我还是知道现在的输入法还是没有真正的智能的,也就是不能处理好词性和介宾关系。
正因为如此,一旦用户词库参与智能组词,结果就会变成了按词频来组词。所以我是反对在这样不成熟的情况下盲目开放用户词库参与智能组词的。这样做的结果可能就是满足了部分资深用户,而失去了广大普通用户。更严重的是落下了一个智能性差的不好名声。
不过qq的半开放还是可以借鉴的。
7
发表于 2008-7-28 10:01:53 | 只看该作者
收到,感谢楼主的建议,欢迎回归。

诚如斯言,无论在智能组句方面,还是在排除重码方面,抑或是便捷性方面,紫光华宇都存在改进的必要性和可能性,我们会持续努力。

需要说明一下的是顶帖中提到提高智能性,从处理好词性、介宾和词频入手,与现在的主干路线不符,目前的做法还没有利用词性,更没有区分介宾,完全是基于字词之间连接关系的统计实现的,准确地说,输入法还没有智能,当用户键入长串拼音后,只是利用已有数据资料,把“最有可能”的字词们码出来,“最有可能”的意思是“这么码出来的话,别人说得最多”。

所谓的模型库就是存放字词连接关系程度的,其中包含哪些字词之间的关系呢?来源是先对语料分词,再来收集和统计频度,于是就必需一个高质量的分词词典(当然,算法也是不可忽视的),可惜,遍查网络,也难以找到一个可拿来使用的、可满足期望的分词词典,只好自己加工打造,限于精力,疏漏难免,故而只能细水长流。由于这个路线的限制,对于用户自造词参与智能组句,就有不少困难了,主要是自造词一般不在分词词典中,它与别的字词的关系也就不存在于模型库中,通过算法处理时,必定茫然,解决之道是靠人工给定一些经验参数,但经验参数是否合理,是否会造成“拆东墙,补西墙”或者“按倒葫芦起了瓢”的现象(估计一定会出现),均需大量测试,功耗极大,因此,目前尚未实现。

楼主的建议很不错,开发团队也有所意识,待逐步引入多种辅助机制去完善吧。
6
 楼主| 发表于 2008-7-27 22:58:27 | 只看该作者
怎么没有见野风版主发表意见,起码应该对智能化水平的提高说说看法。转告一下四哥。
5
发表于 2008-7-27 22:34:04 | 只看该作者
同意!
辅助码功能必须加强,而且必须要“笔画辅助码”,其他辅助码有当然更好,可以选项形式让用户选择。
4
 楼主| 发表于 2008-7-27 21:12:06 | 只看该作者
紫光的声调辅助可能有一定的群众基础,所以开发组不妨下载新华拼音试试,当然了这是针对双拼用户的,全拼用户可以考虑用数字键直接辅助。
不过我还是坚持不要忘了用五笔画辅助码。
笔画辅助码有两点好处:一是过滤比四声调强。二是可以用到简拼和简码上面。这个方面建议开发组的人下载拼音加加试试“67890”直接辅助码
3
 楼主| 发表于 2008-7-27 18:30:13 | 只看该作者
原帖由 krsun 于 2008-7-27 17:57 发表
紫光目前的音调辅助使用起来比较麻烦,确实是可惜了。
我曾经建议过借鉴ABC的按空格键显示候选汉字模式,可以在输入中直接使用音调辅助。
或者提供一个选项可以允许1/2/3/4键直接音调辅助,shift+1/2/3/4键候选词 ...

声调如果是全拼的话可以放在6789这四个键,毕竟全拼用户要选的多,这个可以参考加加的“67890”五笔画直接辅助码,对于双拼用户可以直接像新华拼音那样放在字母键盘上面。

[ 本帖最后由 岳家军 于 2008-7-27 19:09 编辑 ]
2
发表于 2008-7-27 17:57:50 | 只看该作者
紫光目前的音调辅助使用起来比较麻烦,确实是可惜了。
我曾经建议过借鉴ABC的按空格键显示候选汉字模式,可以在输入中直接使用音调辅助。
或者提供一个选项可以允许1/2/3/4键直接音调辅助,shift+1/2/3/4键候选词上屏。

因为紫光目前的词频是很好的,输入中大多数的情况都可以直接上屏,位于2/3候选的词也可以通过使用快捷键左右shift或ctrl选择,其实数字键选的机会已经很少了,不如把直接数字键留给音调辅助功能。

我在许多情况下如果不使用音调辅助可能想输入的词条不再首选,但是使用音调辅助就可以变成首选。

另外还希望音调辅助的键位可以由用户自己定义,现在使用1/2/3/4对左手的负担比较重。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 19:51

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表