华宇拼音输入法论坛

标题: 6.1正式版的bug,自动识别还需加强 [打印本页]

作者: michsun    时间: 2008-2-15 20:02
标题: 6.1正式版的bug,自动识别还需加强



上图直接键入che’nai 会识别尘埃
而下图的he‘chu’er‘che’nai 就无法识别尘埃了

这个问题需要修复一下吧这句“何处惹尘埃”也算是名句了!
作者: ZXD4G    时间: 2008-2-16 00:01
这个问题不算是bug,算是缺陷吧。它与智能组词无关,而是音节自动切分的质量不佳,此乃改进用力之处。
另外,这个名句的完整段子,已经收入词库——ptbw*——菩提本无树,明镜亦非台,本来无一物,何处惹尘埃?
作者: 落寞的湖    时间: 2008-2-16 02:22
应该是个缺陷。
另外,请教左总:ptbw* 菩提本无树,明镜亦非台,本来无一物,何处惹尘埃?————这种编码格式有人喜欢,有人不习惯。个人以为名诗、名段还应以句收入词库为好,整首、整段可交由网友自己去捣弄。
作者: sanwsw    时间: 2008-2-16 12:03
原帖由 落寞的湖 于 2008-2-16 02:22 发表
应该是个缺陷。
另外,请教左总:ptbw* 菩提本无树,明镜亦非台,本来无一物,何处惹尘埃?————这种编码格式有人喜欢,有人不习惯。个人以为名诗、名段还应以句收入词库为好,整首、整段可交由网友自己去捣弄。

关键看你对“句”如何理解。“何处惹尘埃”算一句,“本来无一物,何处惹尘埃”也算一句。现代人说话、写文章中引用古诗文名句,绝大部分是全句引用,像只引用“更上一层楼”这样的名句几率较少。所以,我一再主张以完整的对句为一词条。可以收入“欲穷千里目”、“欲穷千里目,更上一层楼。”,而无必要再收一个对句的后半句(只是举例说明,“更上一层楼”本身还是要收入,因其单用场合更多)。
作者: 落寞的湖    时间: 2008-2-16 14:24
原帖由 sanwsw 于 2008-2-16 12:03 发表

关键看你对“句”如何理解。“何处惹尘埃”算一句,“本来无一物,何处惹尘埃”也算一句。现代人说话、写文章中引用古诗文名句,绝大部分是全句引用,像只引用“更上一层楼”这样的名句几率较少。所以,我一再主张 ...




可能使用习惯不同,我写文章很少整句整段引用。拆开来作词条用也许更灵活,我的词库就是按此思路整理。
作者: michsun    时间: 2008-2-17 00:32
多谢四哥指教!明白了!
作者: 889900    时间: 2008-2-17 11:16
但是打了一遍还是记不住,本来打了一遍能记住这个词的
作者: 中家    时间: 2008-2-19 09:41
我很不赞成自动切分音节的设计,chen‘ai,在打字的时候多输入一个单引号应该不是很困难的事情,对输入法的智能化判断带来的好处太大了。偷懒省略了这个单引号,看似是省事了,其实增加了同一拼音下的汉字组合,降低了输入法的智能化程度,不一定真省事。
盲目省略单引号与盲目使用简拼是一个道理,贪小便宜惹大麻烦。
作者: ZXD4G    时间: 2008-2-19 10:24
中家朋友应该是资深用户了,感觉上一定参与过一些音字转换的探索,甚至设计,对完全的智能期望值减低了,与我们目前遭遇的一些窘境有类同之处,但我们仍然存有改进智能的念头,只是行百里者半九十,越往后越难。在当前有些智能而不是特别智能的发展阶段,能以真正的人脑智能去准确干预一下机器智能的输入习惯,也算是一种磨合之后的、较为稳健的习惯吧。

另外,关于词条收录的思路,寂寞的湖与老戴并无大的分歧,例如:寂寞的湖应该不会把《长恨歌》的每一句都形成一个词条吧,对《登鹳雀楼》的完整词条也不至于反感到什么程度吧,老戴也一定会把《长恨歌》中的若干名句,至少有十来句吧,单独拆分为词条,《登鹳雀楼》亦如是。
整首或整段的名句,会有人喜欢,还有一些特殊的应用场合,应该支持,单句更加著名,或者单句可以灵活使用的,适于拆分出单独的词条。一首诗、词、歌、赋、偈,究竟会形成几个词条,在加工整理的过程中,会受到作者鉴赏能力、语言表达能力等多方面的影响,所以细节之处,各家难免有异议,尽力发散思维去兼顾吧。
作者: 一粟    时间: 2008-2-19 11:34
原帖由 ZXD4G 于 2008-2-19 10:24 发表
中家朋友应该是资深用户了,感觉上一定参与过一些音字转换的探索,甚至设计,对完全的智能期望值减低了,与我们目前遭遇的一些窘境有类同之处,但我们仍然存有改进智能的念头,只是行百里者半九十,越往后越难。在当 ...


看了以上各楼主的发言,我也想提两个建议:
①:对通配符*的功能扩充。目前*只能用在拼音后,即必须知道短句的头几个字发音。但有时有些分段句一时只想起后半段,那肯定是一下打不出了,如果用**代表前后匹配,就更方便了,比如:不以规矩,无以成方圆。我一时记成是“不知规矩”或是“不懂规矩”,那整段就打不出,不过“无以成方圆”我是很熟的,如果用wychfy**来匹配前后,就方便多了。
②:长句、段落的输入应该还是要有。如“长恨歌”,或“曾经有一段爱情摆在我面前,我却……”,很多经典需要信手拈来,如果用一个特殊符如v*来表示长句输入,可能更方便些。
另外,快捷键的用户自定义也很重要,最好是用可选方法决定是否启用快捷键的用户自定义,以免电脑不熟悉的用户无意间改动导致误会。




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2