华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 16766|回复: 23
打印 上一主题 下一主题

一个新用户对紫光拼音的新年企盼

[复制链接]
跳转到指定楼层
1
发表于 2010-1-1 23:20:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
以前使用了多年的五笔,最近一个月才转到拼音上来。这两天试用了一下紫光拼音刚发布的6.6正式版和论坛上下载的大语言模型,在比较中感觉加载了大语言模型后的紫光拼音,其语句智能识别率在当前桌面拼音输入法中算是数一数二的。虽然离理想状态还有相当距离,不过目前来说这个成绩还是值得肯定的。受此鼓舞,专门注册了这个论坛ID,上来把自己的一些想法与紫光拼音的开发者和热心用户朋友们交流一下。

对拼音用户来说最理想的输入状态,应该是输入法提供极高的智能识别能力,用户根本不用管那么多,打字时只管按拼音输入,然后标点上屏,要打的话都基本无误地出来了。所以语句的智能识别技术是拼音输入法中的技术上的珠穆朗玛峰,皇冠上的明珠,迟早必须要跨越的关键和难关。所有别的输入功能其实基本上是辅助作用的。谁能率先在这上面取得实质性突破,谁便能在赢得用户和市场认可上取得有利先机。

之前在语句智能识别技术上,与紫光差不多同时出道的黑马神拼和智能狂拼做过先锋式的探索,可惜他们的理念在十年八年前的条件下显得有点超前,最后没有坚持下来。如今电脑计算能力、网络资源、语料数据、用户需求等各方面的“土壤”都已成熟,该是拼音输入法取得实质性进步的时候了。紫光拼音在大语言模型的研发上是个有价值的尝试,应该沿着这条路走下去。

如今搜狗拼音已利用其网络数据与大规模计算能力优势推出了云输入技术,在语句智能识别上取得相当的突破(该技术据说很快将集成到桌面输入法上来)。相信未来两三年内,语句智能识别将是各大拼音输入法的竞争和快速进步的主战场。从竞争上讲,紫光拼音虽然没有几大互联网公司在语料和计算能力方面的优势,但是紫光拼音也没有这些互联网公司的一个共同劣势:不少用户对这些商业气息浓厚的输入法在个人隐私和广告打扰方面有很大疑虑和反感。

所以紫光拼音这个品牌在成长了十年之后,在下个阶段的方向在哪,我觉得重点应该非常明确:重拾其在桌面输入法上现有的智能技术优势,进一步不断改善其智能算法和语言模型(质量和规模),将其输入的流畅程度进一步提高,重新拿回仍然足够广阔的市场空间。

与此同时,作为对语句智能输入的辅助功能,在新的版本中最好能完善语句输入的如下配套功能:

1、放开输入字数的16个字的限制(这个限制似乎是当前多个主流拼音输入法中紫光的“特色”)

2、在输入候选框中光标的快速定位修改(紫光现在光标定位修改方面是当前主流输入法中做得最差的,甚至都远远不如搜狗QQ之流,建议直接参考狂拼新版的空格键+声母进行定位功能,这可能是最方便的。)

3、辅助码功能:间接辅助码、直接辅助码、自定义辅助码……关于辅助码功能的好处和建议,我看到好多朋友在论坛上都提过,我觉得紫光拼音是时候在新版本中好好考虑一下了。这个技术应该是辅助性输入功能中比较有技术含量的一点了。

前两天看到有一位版主提到紫光新的版本将会是7.0版,将会有很大的创新,让人期待。希望在新的2010年,看到一个重新活力十足的紫光拼音。:)

在这里作为一个论坛新人,顺祝各位紫光开发者和老用户朋友新年快乐!
2
发表于 2010-1-1 23:40:07 | 只看该作者
专业不失通俗,随性不失逻辑,诚恳不失渴望,新年同 乐。
3
发表于 2010-1-1 23:54:12 | 只看该作者
关于其它几方面的建议还是不错的,但是对于整句输入,楼主的理解是存在误区的。无论输入法如何智能,因为语言的多变性,16个字之后【甚至四个字之后】输入法都是不可能完全辨别出来正确的输出字。实践证明,把句子拆成两字或者3字或者四字的词语然后分别上屏,是智能拼音输入法最正确的输出方式。
采用良好的大词库,使用以词为主的输入方式,是拼音输入法正确的选择。
身为超版,必将担负起论坛意见的正确导向,事关输入法的发展方向,请楼主谅解。
顺致元旦快乐!
4
 楼主| 发表于 2010-1-2 00:21:33 | 只看该作者
原帖由 fengyu29 于 2010-1-1 23:54 发表
关于其它几方面的建议还是不错的,但是对于整句输入,楼主的理解是存在误区的。无论输入法如何智能,因为语言的多变性,16个字之后【甚至四个字之后】输入法都是不可能完全辨别出来正确的输出字。实践证明,把句子拆 ...


谢谢回复!有一点不同看法想交流。

我也是一个输入法爱好者,这种意思的话我看过很多,加加论坛那边尤甚。但是我觉得,语句智能识别的问题,现在技术做不到的水平,不等于不能改进,不等于今后一直做不到。现在做不到,以及短句做得好,长句识别的差,根本原因在于现在的算法非常初级,主要是基于语料关系概率的二元算法吧,还没有涉及到语法、语义等方面。

当然你可以说,以紫光拼音的现有实力或者定位,以后也没有这方面的计划和想法,我可以理解,毕竟这涉及到技术、商业各方面。我发这个帖子,提这个想法,是一个比较长远的理想,但也是我相信拼音输入法最后决胜的关键所在。为什么?因为这是用户最需要、最舒服的状态。当然你可以争论说打词语、短语也很习惯,甚至有人打单字也很快,但是要明白,这并不是人天性最理想的状态,而只是人在条件限制下不得已而形成的习惯——甚至很多人都已经习惯到没有意识到这点了。但是假如有某个输入法先做到了,给人自由选择的话,用户是需要他每时每刻盯着屏幕进行人为干预的输入法,还是一个根本不需要他时时刻刻小心翼翼,而是身心放松、输入过程简单高效的输入法?

是的,这是理想状态,但是正是人性需要的理想状态让技术不断进步。(正好今天在论坛上看到一位朋友的一句话,很赞同,意思大致如下:不要因为造不出宇宙飞船,就认为飞机也不如自行车。)

[ 本帖最后由 wozy 于 2010-1-2 00:26 编辑 ]
5
发表于 2010-1-2 01:13:34 | 只看该作者
楼主说的3点我都支持,并且也希望紫光能够加入。只是紫光虽然智能性不坏,却还是主要定位在字词+全拼输入上,所以窃以为官方能听进去并在下个版本就改进的可能性不大。。。
6
发表于 2010-1-2 09:44:38 | 只看该作者
智能的改进是编程算法中难道最大的部分
7
发表于 2010-1-2 10:29:23 | 只看该作者
整句智能其难点在于候选句的复杂多变性。
比如“你是从那个方向来的”和“你是从哪个方向来的”,这两个短句,无疑都是正确的。我要的是第一句,而你要的是第二句,那么输入法怎么判断我和你之间是如何判断需要输出哪句话呢?总不成把候选句全罗列出来让大家选吧,那将涉及到很多候选语句条以及候选框的大小等因素的制约。我举的例子只是个简单的例子,实际上,对于有几十个字的长语句来说,候选语句会更更多。
8
 楼主| 发表于 2010-1-2 10:55:29 | 只看该作者
原帖由 fengyu29 于 2010-1-2 10:29 发表
整句智能其难点在于候选句的复杂多变性。
比如“你是从那个方向来的”和“你是从哪个方向来的”,这两个短句,无疑都是正确的。我要的是第一句,而你要的是第二句,那么输入法怎么判断我和你之间是如何判断需要输出 ...


我当然知道拼音输入法的智能识别技术的难度很大,所以帖子里才有“珠穆朗玛峰”“皇冠上的明珠”等说法。同时语句智能识别技术再发达也不能做到100%,但这不是否定智能识别技术的充足理由。其实输入法中的语句智能识别技术就跟人们的说话交流、电脑的自然语言识别这些东西一样或类似的东西。没有百分之百的精确,总是带着一定的模糊性和歧义性,只要认真想想,就会发现其实平时人们的说话交流也一样,也有模糊不清、理解错误、需要增加“辅助码”(额外解释)的时候。

所以语句识别中像“他/她/它”“哪里/那里”之类的,其实不是简单的例子,而是一些特例,需要加入更多元素处理,比如真正智能技术中还需要考虑“语境”,比如一定范围的上下文,比如一两段话。当然你会说这又增加了计算负荷,是的,但是是计算技术能做的事情,对电脑来说就不是不能解决的问题,而只是一个时间和成本的问题。

刚才说到输入法中智能识别技术与人们自然语言的比较,这是一个巨大的话题,深究下去自然会引出很多区别来,比如说人们说话带调(但别忘了人们说话中带着很大的语音模糊性,因环境或口音的差异,而电脑输入则在这方面确定性强得多,这是个补偿)、人们的知识积累(其实电脑在知识积累的记忆方面和广泛程度要比人好得多。),但是是有极大的直接关系和借鉴意义的。

[ 本帖最后由 wozy 于 2010-1-2 10:56 编辑 ]
9
 楼主| 发表于 2010-1-2 11:04:42 | 只看该作者
我知道紫光拼音之前的定位主要在字词和短语上。如果没有紫光的大语言模型的出现,可能我也不会对紫光拼音有这个企盼,就像我对拼音加加没有这个奢望一样。之所以发这个帖,自然是从紫光的现有技术、开发实力和未来的可能创新有关联,所有有些新盼头。

其实对一般用户来说,并不关心什么是字词输入法还是句子输入法,这都是专业人士人为贴上的标签。一般用户只关心的是,这个输入法用起来流畅不流畅,省心不省心。显然语句识别技术高的输入法正是一般用户最省心的(当然现在还没有达到这种水平的输入法出现)。
10
发表于 2010-1-2 11:07:53 | 只看该作者
可能搜狗的云,准确率还算比较高的——如果算智能的话。
11
发表于 2010-1-2 11:10:51 | 只看该作者

google 拼音很智能,但是我不习惯

可能有些跑题…………
我用google 拼音,发现它确实很智能,能根据我前面的输入,推断我后面要输入什么。
比如我要输入“他不是我认识的”
输入 认识 后,按空格上屏。
再按 d,如果按词频,按 d“的”通常是第一位的。
但是 google 拼音聪明地认为“认识d”应该是“认识到”,于是第一个候选是 到。。。
类似的例子还很多。都是在qq聊天里碰到的。用紫光似乎完全没有这个担心。基本上第一个候选项就是你要的。(搜狗和QQ好像没那么贴心)。
总之,google 拼音给我的感觉是太聪明,总是猜我下一步要干吗,但是又总是猜错,可谓聪明反被聪明误。有时候智能太过了也不烦人。。。
12
 楼主| 发表于 2010-1-2 12:17:29 | 只看该作者
嗯,搜狗云的智能识别技术是蛮高的,今后也会更高——这将刺激其他输入法开始在智能方面动起来。不过搜狗和其他互联网公司的技术总让人担心用户隐私问题,不太让人放心使用。应该是这正是紫光拼音的一个市场空间所在。

如果仔细比较,谷歌拼音的识别率在当前输入法中并不算很出色,加载了大语言模型的紫光,甚至搜狗应该都比它强些。

[ 本帖最后由 wozy 于 2010-1-2 12:18 编辑 ]
13
发表于 2010-1-2 17:19:44 | 只看该作者
原帖由 fengyu29 于 2010-1-2 10:29 发表
整句智能其难点在于候选句的复杂多变性。
比如“你是从那个方向来的”和“你是从哪个方向来的”,这两个短句,无疑都是正确的。我要的是第一句,而你要的是第二句,那么输入法怎么判断我和你之间是如何判断需要输出 ...

此时如果像楼主说的,可以通过按住空格键(是按住,而不是按一下)+两次n(只按一次n会定位到“你”)的方式快速定位到“na”并加以选择,不就很方便了吗。据楼主所说,智能狂拼2009已经实现了此功能,紫光可否也。。。
14
发表于 2010-1-2 17:26:38 | 只看该作者
搜狗的云输入法是靠4G的超大语言模型200W的词库做后盾撑起来的。囧
我现在蛮希望紫光能加入拼音加加的那种直接辅助码:键入拼音之后直接Tab,然后输入首笔画直接定位
这样就不用老是翻页了

[ 本帖最后由 柴子 于 2010-1-2 17:27 编辑 ]
15
发表于 2010-1-2 18:50:31 | 只看该作者
原帖由 柴子 于 2010-1-2 17:26 发表
搜狗的云输入法是靠4G的超大语言模型200W的词库做后盾撑起来的。囧
我现在蛮希望紫光能加入拼音加加的那种直接辅助码:键入拼音之后直接Tab,然后输入首笔画直接定位
这样就不用老是翻页了

晕倒,柴子兄弟,那叫“间接辅助码”。直接辅助码是不用tab键的
16
发表于 2010-1-2 21:24:50 | 只看该作者
原帖由 岳家军 于 2010-1-2 18:50 发表

晕倒,柴子兄弟,那叫“间接辅助码”。直接辅助码是不用tab键的


嗯,我溜嘴了
嘎嘎,反正能用辅助码就好了,用辅助码比翻页要舒服很多
17
发表于 2010-1-2 22:40:03 | 只看该作者
我加一个64位兼容
18
发表于 2010-1-2 23:38:49 | 只看该作者
希望两字词能够使用辅助码。
19
发表于 2010-1-2 23:46:02 | 只看该作者
希望智能组词也可以使用辅助
20
发表于 2010-1-3 07:05:26 | 只看该作者
关于辅助码,全拼适合间接辅助码(tab),双拼用直接辅助码效果更好。对直接辅助码要可以自定义。辅助码的使用对1到3字词有效(有的输入法是对1、2字词有效)。
另外建议:
1、加强输入面板的自定义皮肤功能,至少对特殊短语词库可以设置词条显示颜色。
2、禁止“双拼的不完整输入方式”。详情请见:
http://bbs.unispim.com/viewthread.php?tid=8314&extra=page%3D4
21
发表于 2010-1-3 08:43:21 | 只看该作者
原帖由 krsun 于 2010-1-2 23:46 发表
希望智能组词也可以使用辅助

支持!这样修改就方便了。
但似乎现在的紫光连光标移动定位都做不到,希望加强这个功能不会有损紫光发展的导向。。
22
 楼主| 发表于 2010-1-3 12:43:24 | 只看该作者
看来大家对辅助码功能的呼声的确是比较高的啊:)

原帖由 平庸※迷茫 于 2010-1-3 07:05 发表
辅助码的使用对1到3字词有效(有的输入法是对1、2字词有效)。


这个字数没必要特别限制。只要是重码的词辅助码都可以起到分离作用,看看狂拼的做法.
23
发表于 2010-1-3 15:47:47 | 只看该作者
对,应该不加限制最好。
24
发表于 2010-3-14 16:45:57 | 只看该作者
在新版本即将动工之际,顶起这个老帖子,希望对开发组起到借鉴作用!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-26 02:07

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表