华宇拼音输入法论坛

标题: 建议支持超级简拼的混合使用 [打印本页]

作者: richardfsw    时间: 2012-2-3 22:43
标题: 建议支持超级简拼的混合使用
作为一个全拼用户,我输入文字习惯使用完整拼音编码,偶尔遇到长词,可能会使用超级简拼,而紫光定义的“不完整拼音”(省略整个韵母,保留整个声母)几乎是从来不用的,因为它会增加重码,而且节省不了多少时间,最关键的是会打断一般的全拼思路
超级简拼则因为对应长词(≥4字),不仅节省了较多的击键时间,而且重码也不再是大问题

但是现在紫光的要求我觉得过于严苛,一次上屏输入中必须从第一个音节开始使用超级简拼,否则就未必能输出想要的结果。
举例说明:
“身份证号码”是一个符合超级简拼要求的词库中已有的词,我可以使用完整拼音输入,甚至不需要打完就会有候选出现:

我也可以使用超级简拼:

但是还有一种情况:我习惯性地输入了全拼shen,然后突然想到这是个词库中应该存在的且符合超级简拼长度要求的长词,应该可以用简拼提高效率,紫光的反馈如下

这个时候,翻遍全部候选,都不会出现“身份证号码”这个词

这个问题其实是紫光没有把z和h作超级简拼处理,把它们理解为了一般简拼的zh。我认为,超级简拼的门槛应该降低。只要检测到总长度≥4(或其他设定值)的拼音串,能够按照超级简拼理解的部分,就尝试进行超级简拼的词库检索,列出符合条件的候选。说得更简单一点,但凡遇到双声母编码zh、ch、sh,都尝试一下合并作声母和分别作声母两种可能。如果词库中有符合的词,就输出,如果没有,再按照现在的划分方法智能组词。根本上是要解决简拼后无法输出词库中已经存在的对应词的问题


其实这不仅仅是超级简拼的问题,这涉及到对拼音的理解问题,和紫光现在的软肋特殊音节理解本质上是一样的。现在紫光的弊端可以用这个例子来体现:
由于关闭了智能组词入库,所以我先手动造词“早好了”,显然,3字词,这和超级简拼无关
这个词,全拼当然可以输入,但是按照紫光对“不完整拼音”的定义,zhaole也是表达该词的合法编码,但实际上这样是无法输出的


作者: 觉贤    时间: 2012-2-4 13:16
纯技术帖,只能顶帖;看来紫光输入法今年还可能更新
作者: ljdqe    时间: 2012-2-4 16:29
原帖由 觉贤 于 2012-2-4 13:16 发表
纯技术帖,只能顶帖;看来紫光输入法今年还可能更新

当然会继续更新,实际上已经开始了6.9版本的内测了
作者: 好休闲    时间: 2012-2-4 17:06
顶,同感。
作者: 1003    时间: 2012-2-4 17:12
原帖由 ljdqe 于 2012-2-4 16:29 发表

当然会继续更新,实际上已经开始了6.9版本的内测了

泄露机密!
作者: 紫光蓝天    时间: 2012-2-4 18:23
6.9词库野风老大早已上传了
作者: 觉贤    时间: 2012-2-4 22:36
我在用大语料库,还是比较爽的,知不知道更新不?狂拼150多兆、自然码60多兆;不联网词库还是用处很大的
作者: richardfsw    时间: 2012-2-5 18:10
标题: 回复 7楼 的帖子
不对比不知道。虽然单独使用没什么感觉,但是用惯了大语料库之后重装紫光,发现自带的小语言模型,响应速度真是快
作者: 觉贤    时间: 2012-2-5 21:40
没什么明显的差距
作者: krsun    时间: 2012-2-6 10:12
这个还是解析的问题


作者: richardfsw    时间: 2012-4-11 18:48
本帖最后由 richardfsw 于 2012-4-11 19:11 编辑
这个还是解析的问题
krsun 发表于 2012-2-6 10:12


嗯,但是现在看来,确实不是音节解析那么简单的,还是涉及到主楼说的,超级简拼的混合使用问题。请看下例(从颜色判断,“职业技术学院一词已经存在于词库之中):
标准全拼 标准超级简拼 全拼混合超级简拼 全拼混合超级简拼 全拼混合普通简拼 普通简拼 普通简拼混合超级简拼


希望官方能优化输入时的词条检索机制。貌似涉及到双声母是否模糊的问题。现在的情况看起来似乎是,只要有一个字不符合超级简拼的要求/条件(即,仅用一个字母表示一个音节),无论音节数多少,就都不理解为超级简拼(不进行双声母模糊)。我认为,上述图片中的几种输入方法,都应该能够得到“职业技术学院”才比较好(也就是说,是否模糊处理只取决于总音节数,或者说字数,即设置项里的数值,而不应该受其他音节输入方式的影响)。何况这个词还不涉及音节解析,不可能“切”错音节
作者: michsun    时间: 2012-4-11 19:50
也希望早日支持,平时这种使用也很多的,尤其是对很多人在聊的时候~
作者: ljdqe    时间: 2012-4-11 20:24
这方面能够改善当然最好咯
作者: krsun    时间: 2012-4-12 10:09
本帖最后由 krsun 于 2012-4-12 10:10 编辑

根子还是在拼音解析上
如果一串音节可以解析出所有的合法拼音(包括全拼、简拼、混拼),然后再将解析结果与词库现有词汇比对,给出符合需要的候选,那么就不会出现这样的情况。
超级简拼其实只是简拼的一种特例,简化了简拼的情况,并没有考虑混拼。
觉得现在的解析程序是:
如果进入超级简拼状态,解析程序会先按照超级简拼解析,如果中间发现输入串不符合超级简拼(比如出现了混拼),就会退出超级简拼状态,按照一般拼音处理。
解析程序一般处理方式就是先尽量按【声韵】配对的方式解析输入串,对于不能解析为【声韵】的组合,再尝试解析为简拼。
如果能直接解析出全部可能的组合,然后再跟词库比对,应该就不会产生遗漏。
作者: 紫光蓝天    时间: 2012-7-15 12:38
既然楼主在另一个帖子里推荐这个帖子,我就顶一下吧
不过我觉得省略首字母打不出是很正常的
省略什么也不能省略音节的首字母啊
作者: wangyanhan    时间: 2012-7-15 13:21
(一)我用紫光的时间非常少,这几天使用多一些。在全拼模式下,和加加的全、混、超简输入操作一对比,其感受是明显的。所以非常支持楼主这篇“音节解析”帖,期盼在算法上有所改进。

(二)赞成蓝天版主的观点,在每一音节上,声母是不可以省略的,这是算法的依据,省略了会更乱套。
作者: richardfsw    时间: 2012-7-15 13:28
既然楼主在另一个帖子里推荐这个帖子,我就顶一下吧
不过我觉得省略首字母打不出是很正常的
省略什么也不 ...
紫光蓝天 发表于 2012-7-15 12:38



    呃……但是这里并没有出现省略首字母的情况。这帖子里主要讨论的是省略双声母的“h”会出现的诸种问题~
作者: 紫光蓝天    时间: 2012-7-15 15:41
一楼贴出的混拼贴图均省略了音节的首字母
作者: wangyanhan    时间: 2012-7-15 16:23
在自动模糊和模糊音设置里,卷舌音都是模糊的主要内容,简拼肯定要遵守这些规则。
作者: richardfsw    时间: 2012-7-15 16:55
回复 18# 紫光蓝天


    蓝天兄指的是两个词组最后的截图么?

其实是紫光切分错误而已——shen'f'zh'm其实指的是首字全拼,其后超级简拼shen'f'z'h'm

与之类似,zhao'le的本意是普通简拼混合全拼z'hao'le
作者: 紫光蓝天    时间: 2012-7-15 17:00
我指的是
shen'f'zh'm你省略了第四个音节hao的首字母h
zhao'le你也省略了第二个音节hao的首字母h

作者: richardfsw    时间: 2012-7-15 17:04
本帖最后由 richardfsw 于 2012-7-15 17:13 编辑
简拼肯定要遵守这些规则。
wangyanhan 发表于 2012-7-15 16:23



    考虑这一点的话,就会比较繁琐。因此超级简拼才格外有意义:
    对于大多数人,我认为是以全拼为主的。一方面是因为重码少,更重要的是拼音全拼的音节总数有限,很容易形成肌肉记忆,音节输入成为下意识的组合动作,从而提高速度

    简拼打破了这种组合,所以击键速度肯定会比全拼慢。这个时候,我不希望再去考虑是否双声母、要不要加h的问题,那会进一步增加延迟,而削弱简拼的提速作用。这就是为什么超级简拼要模糊掉卷舌音

    但是在全拼输入的时候,区别卷舌和平舌音能够大幅降低重码。这就是为什么全拼时要尽量避免模糊卷舌音
作者: richardfsw    时间: 2012-7-15 17:08
本帖最后由 richardfsw 于 2012-7-15 17:09 编辑
我指的是
shen'f'zh'm你省略了第四个音节hao的首字母h
zhao'le你也省略了第二个音节hao的首字母h
紫光蓝天 发表于 2012-7-15 17:00


    shen'fen'zheng'hao'ma

   
zao'hao'le

如上可见,所谓“省略首字母”的现象,并非我本意

作者: bbc0556    时间: 2012-7-15 17:54
我是来看楼主的皮肤和字体的,很好看~
作者: richardfsw    时间: 2012-7-15 18:58
我是来看楼主的皮肤和字体的,很好看~
bbc0556 发表于 2012-7-15 17:54



    谢谢~
    不过都是最基本的啦,自带的BLACK X皮肤和微软雅黑、Arial字体
作者: cdrwking    时间: 2012-7-18 00:30
为什么我的black x皮肤就没楼主的好看呢?




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2