华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 18888|回复: 27
打印 上一主题 下一主题

关于整句输入及准确率

[复制链接]
跳转到指定楼层
1
发表于 2008-1-31 10:23:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
在SG论坛看到颇有些人质疑ZG的“引领整句输入”一说,甚至有人说咱“连整句输入是什么都不知道”,脑海中只有五个字——无知者无畏。
这五个字恰恰也是最近几个月来自身的体会,我们确实是从无知无畏起步,那时,GG的整句输入是咱们的近期赶超目标,为了避免无知地作出判断,耗费一个来月的时间用于搜集素材和进行大规模测试,测试报告曾发在志愿测试版块了,也被转载到SG论坛了,但很多人还是宁愿相信几个词句的点试,而无视甚至贬低统计数据的说明力,让人既恨又怜。说实话,要是在这个PK中没有把握,6.1很有可能现在还发不出来。

测试报告是本人亲自操办的,其间没有半点儿虚假,只是不想公开具体的测试例句而已(总共有二百几十万句,原因随意猜测,概不理会),报告的结果清晰地展示了我们的准确率高于另外2G。昨晚出台几个档次的数据模型资料,一是响应用户的期待(愿意牺牲一些计算机资源而追求准确率的用户),二是想说明整句输入大有可为,虽然在技术上仍有薄弱之处(例如模型压缩和语料纠错等方面),但前景依然光明。

正要下载QQ新版试试,仍拟坚持以数据说话。
2
发表于 2008-1-31 10:25:58 | 只看该作者
中国人历来都是感性的,宁愿相信自己的感觉而不相信数据。
3
发表于 2008-1-31 10:31:02 | 只看该作者
桀之犬可使吠堯,跖之客可使刺由。各為其主耳。
不是咱們自己人自然要罵一罵咱們,這是毛主席所說的「本位主義」。

左盟主就不必深究了,權當作飯後「開心一刻」。
4
发表于 2008-1-31 11:08:38 | 只看该作者
我打一两句话就知道哪个更强了,你要打几万句...

整句大有可为,但也看谁去为,至少我早看出狂拼的wow不能为也.

[ 本帖最后由 真拼音佳佳 于 2008-1-31 11:09 编辑 ]
5
发表于 2008-1-31 11:23:37 | 只看该作者
原帖由 真拼音佳佳 于 2008-1-31 11:08 发表
我打一两句话就知道哪个更强了,你要打几万句...


自己知道加加可以打出什么句子,自己再测试??可笑~~
6
发表于 2008-1-31 11:24:55 | 只看该作者
楼主说的QQ新版,我说一句:我用的是TM2009Preview版,没有发现兼容性问题!!
7
发表于 2008-1-31 11:29:12 | 只看该作者
原帖由 真拼音佳佳 于 2008-1-31 11:08 发表
我打一两句话就知道哪个更强了,你要打几万句...

整句大有可为,但也看谁去为,至少我早看出狂拼的wow不能为也.

智能狂拼现在是wow 一个人单枪匹马地单打独斗,而紫光是一个团队,没有可比性!
8
发表于 2008-1-31 11:38:22 | 只看该作者
我不懂专业。但从自己文字输入的感觉来说,狂拼其实也是一个很好的软件。输入过程中,难免偶然出现一些错误,但改起来非常便捷。下表定位,辅助码,……,用起来都很方便自然。
9
发表于 2008-1-31 11:46:14 | 只看该作者
  下载了testdata档次的资料,整句输入非常流畅。我简单测试的句子都是现代汉语规范书面语,输入时尽量少一些文言色彩的单音节词,准确性会更高些。
  尽管如此,还是喜欢以短语方式输入。毕竟临屏写作已成习惯,边想边输边改。
10
 楼主| 发表于 2008-1-31 12:06:29 | 只看该作者

兑现刚才的想法

下载了QQ 1.1.113.201,因时间缘故,没有超大规模测试(百万句子以上),就根据昨天现抽取的一万句测试,其准确率为58.5%——不及格,其它的也透露一些。如果质疑例句的客观性,又想发表一些有说服力的观点,自己去多弄点儿吧——不要指望咱友情提供,咱也是有些私心的,不想公布出去,惹得亲痛仇快。
SG 3.1.x.0463   63.7%
SG 3.2                62.6%
GG1.1.27.51     64.5%
总结昨天的ZG成绩:
起步档:66.92%
不错档:69.57%
良好档:71.47%
加强档:72.01%
看官自己去掂量吧。我们的努力——发飙档——非以再增加数据模型规模为代价,而是从别的途径寻求突破,“寻”的过程和“寻”的结果,眼下都有些眉目,更加视为秘密。如觉井底之蛙,尽管拍砖。
11
发表于 2008-1-31 15:09:20 | 只看该作者
有百度拼音了?有百度拼音了?出了?

没听说啊,什么时候出的?
12
发表于 2008-1-31 16:34:48 | 只看该作者
今天在用最大的那个,感觉可以,相对来说高级很多。明天试试第二个,感觉体积和效率这个比较推荐。我不太大长的句子,一般已词汇和短句也就就5个字左右,够用了!

反正继续支持紫光,希望辉煌依旧!
13
发表于 2008-1-31 19:25:03 | 只看该作者
原帖由 kingdick 于 2008-1-31 11:23 发表


自己知道加加可以打出什么句子,自己再测试??可笑~~


没事找事.本来都不是适合打句子的输入法,测试它们打句子的能力,不可笑?
14
发表于 2008-1-31 19:53:49 | 只看该作者
原帖由 真拼音佳佳 于 2008-1-31 11:08 发表
我打一两句话就知道哪个更强了,你要打几万句...

整句大有可为,但也看谁去为,至少我早看出狂拼的wow不能为也.


狂拼3.3只不过是WOW的一个大胆尝试的产物,当然了这个尝试并不成功,因为如此,导致一些别有用心的人总是那这个版本说事情。拼音加加是你一直在支持的输入法,何不用它的最新版本和紫光的这个最新的版本比试一下。
15
发表于 2008-1-31 19:56:42 | 只看该作者
如果QQ拼音、谷歌的语料库和紫光的一样庞大,不知测试的结果会怎样,还会有优势可言吗。
16
发表于 2008-1-31 20:00:17 | 只看该作者
谁说智能狂拼3.3不好?请他说出不好的理由,当然拼音佳佳除外,这个白痴最好不要与他搭话,最近他刚在加加论坛被开除了版主的身份。
17
发表于 2008-1-31 20:08:25 | 只看该作者
原帖由 中家 于 2008-1-31 20:00 发表
谁说智能狂拼3.3不好?请他说出不好的理由,当然拼音佳佳除外,这个白痴最好不要与他搭话,最近他刚在加加论坛被开除了版主的身份。


呵呵!智能狂拼同样是一款优秀的输入法!狂拼II 曾伴随过我很长时间。呵呵!忘了!中家也曾为狂拼的发展出了不少的力!抱歉!
18
发表于 2008-1-31 20:14:06 | 只看该作者
原帖由 洛风 于 2008-1-31 19:53 发表


狂拼3.3只不过是WOW的一个大胆尝试的产物,当然了这个尝试并不成功,因为如此,导致一些别有用心的人总是那这个版本说事情。拼音加加是你一直在支持的输入法,何不用它的最新版本和紫光的这个最新的版本比试一下 ...


我知道它错在哪里,所以加加要改也很容易.能不能是一回事,想不想是一回事.

我知道整句不是什么香窝窝,你要是不知道,你就自己去玩,你要是也知道,你就把强弱对比看轻一些.总算平均码长指标加加还是最强,我看重这个,绝对看重——如果有别的输入法能超过加加,我马上换.
19
发表于 2008-2-1 09:27:20 | 只看该作者
原帖由 真拼音佳佳 于 2008-1-31 20:14 发表


我知道它错在哪里,所以加加要改也很容易.能不能是一回事,想不想是一回事.

我知道整句不是什么香窝窝,你要是不知道,你就自己去玩,你要是也知道,你就把强弱对比看轻一些.总算平均码长指标加加还是最强,我看重这 ...


走到哪里臭到哪里,虱子多了不咬人,是吧佳佳,自封大师。
20
发表于 2008-2-1 09:48:09 | 只看该作者
狂拼的几个家伙走到哪里骂到哪里,臭的是你自己的嘴.
21
发表于 2008-2-1 11:01:41 | 只看该作者
原帖由 真拼音佳佳 于 2008-1-31 11:08 发表
我打一两句话就知道哪个更强了,你要打几万句...




打一两句就知道哪个输入法更强,真神人也!
22
发表于 2008-2-1 11:02:46 | 只看该作者
原帖由 野风 于 2008-1-31 20:08 发表


呵呵!智能狂拼同样是一款优秀的输入法!狂拼II 曾伴随过我很长时间。呵呵!忘了!中家也曾为狂拼的发展出了不少的力!抱歉!  


原来有这档子事。
23
发表于 2008-2-2 16:41:35 | 只看该作者
刚在cnbeta上看到了这样的文章http://www.cnbeta.com/articles/48490.htm
应该是咱们论坛的人发上去的吧
24
 楼主| 发表于 2008-2-3 23:17:38 | 只看该作者
不知道呀,网络的力量和网络时代的行为实在让人惊悚,老实巴交的咱,有些毛了。
25
发表于 2008-2-3 23:31:04 | 只看该作者
天啊
網絡時代啊。。。。。
有問題,那啥一下。。。
26
发表于 2008-2-3 23:41:38 | 只看该作者
这可是一个著名的靶场啊!……四哥去当靶子了!而且还是指名道姓的啊!唉……


[ 本帖最后由 野风 于 2008-2-4 14:40 编辑 ]
27
发表于 2008-2-4 00:08:45 | 只看该作者
原帖由 hblf 于 2008-2-2 16:41 发表
刚在cnbeta上看到了这样的文章http://www.cnbeta.com/articles/48490.htm
应该是咱们论坛的人发上去的吧


我也这样认为! 应该是咱们论坛上的人发上去的!

[ 本帖最后由 野风 于 2008-2-4 00:11 编辑 ]
28
发表于 2008-2-4 00:21:42 | 只看该作者
呵呵,本来我想发来,没通过审核,没想到现在有人给发了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 06:57

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表