华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 25137|回复: 41
打印 上一主题 下一主题

再报一个智能组词的错误

[复制链接]
跳转到指定楼层
1
发表于 2008-7-29 16:50:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
其实错误不止这一个,因为任何输入法都不可能全部正确。但是这个错误比较低级,请版主告知开发组,务必在正式版出来前改善,那怕直接就把这个词加进去。
我刚才和一个武汉的网友聊天,问:你们那里现在还热吗?
我是断开打的:你们那里现在//还热吗?
结果发现:“还热吗?”出来的是“还热码”,然后把句子打全结果是“你们那里现在还热码”。用25兆语料库。
还热吗和你们那里现在还热吗?是比较常见的聊天语言。其实在生活中也会出来一句“还热吗”,想想看是不是这样?
版主务必要告知开发组,正式版这个错词一定要干掉。

[ 本帖最后由 岳家军 于 2008-7-29 16:56 编辑 ]
2
发表于 2008-7-29 17:54:08 | 只看该作者
确实是这样,我的是best。
3
 楼主| 发表于 2008-7-29 17:56:25 | 只看该作者
原帖由 krsun 于 2008-7-29 17:54 发表
确实是这样,我的是best。

汗!80兆的语料库还是一样啊
4
发表于 2008-7-29 21:26:08 | 只看该作者
果然如此,不过修正一次后就可以了!
5
 楼主| 发表于 2008-7-29 21:28:56 | 只看该作者
原帖由 michsun 于 2008-7-29 21:26 发表
果然如此,不过修正一次后就可以了!

这叫记忆吧?现在任何主流输入法都能做到这点。所以不能靠记忆完成任务,如果新手用了一下发现这样的句子紫光都不能打对(之前的帖子我也举了几个例子),而别的输入法能对……。
所以既然发现了还是改正以后再发布。
6
 楼主| 发表于 2008-7-31 17:34:36 | 只看该作者
自从我出这个帖子后,就没有看见版主露过面。
7
发表于 2008-7-31 18:38:12 | 只看该作者
已经收悉此问题,并联想到“还热吧”,也不能正确。

但此问题根源较深,需要从分词词典的修订和完善入手,继而重新对海量原始语料分词,最后才能形成新的数据模型文件,短期内不敢动此干戈,徐图改进吧。

欢迎继续在此报告组句的错误。
8
 楼主| 发表于 2008-8-1 10:36:08 | 只看该作者
有人挑拨和也是有人挑拨,搜狗和加加都对了
紫光出的是:“有人调拨” 和“也是由人调拨”。虽然好像没有错,但是从常用的角度来说,不应该出。
9
发表于 2008-8-1 12:32:15 | 只看该作者
我的可以组词的
best
10
 楼主| 发表于 2008-8-1 16:33:32 | 只看该作者
“算法好”出来的是“算法号”用25兆语料库。

[ 本帖最后由 岳家军 于 2008-8-1 18:04 编辑 ]
11
发表于 2008-8-2 10:09:27 | 只看该作者
原帖由 岳家军 于 2008-8-1 10:36 发表
有人挑拨和也是有人挑拨,搜狗和加加都对了
紫光出的是:“有人调拨” 和“也是由人调拨”。虽然好像没有错,但是从常用的角度来说,不应该出。


没你所述现象。选用最大号的语言模型库。

估计你所用词库中有错词。“挑拨”音tiao'bo,“调拨”音diao'bo。词库中有“调拨 tiao'bo”词条,才有你的现象吧?

[ 本帖最后由 sanwsw 于 2008-8-2 10:18 编辑 ]
12
 楼主| 发表于 2008-8-2 10:55:01 | 只看该作者
原帖由 sanwsw 于 2008-8-2 10:09 发表


没你所述现象。选用最大号的语言模型库。

估计你所用词库中有错词。“挑拨”音tiao'bo,“调拨”音diao'bo。词库中有“调拨 tiao'bo”词条,才有你的现象吧?

别忘了,有废词也是紫光标配的。因为紫光的用户词库不参与智能组词的。
我用的是25兆语料库,请用标配语料库的网友测试一下。
13
 楼主| 发表于 2008-8-2 10:56:24 | 只看该作者
原帖由 sanwsw 于 2008-8-2 10:09 发表


没你所述现象。选用最大号的语言模型库。

估计你所用词库中有错词。“挑拨”音tiao'bo,“调拨”音diao'bo。词库中有“调拨 tiao'bo”词条,才有你的现象吧?

刚才看了一下就是搜狗tiao bo也有“调拨”这个词,不是废词或者错词。
14
 楼主| 发表于 2008-8-2 12:35:04 | 只看该作者
“动态词频”这个词在输入法界应该常用了。但是紫光没有,而且紫光也不能正确组出来。
15
发表于 2008-8-2 12:44:10 | 只看该作者
“动态词频”,我这里一敲就出来了。
16
 楼主| 发表于 2008-8-2 13:25:29 | 只看该作者
原帖由 步虚 于 2008-8-2 12:44 发表
“动态词频”,我这里一敲就出来了。

可能用的词库不同吧,我是标配的词库所以没有这个词,智能组词是“动态次品”25兆语料库
是不是请那位用标配的语料库和词库试试?
17
 楼主| 发表于 2008-8-2 13:47:27 | 只看该作者
“刚试过”这个智能组词,搜狗和加加正确。紫光出的是:港市国
18
发表于 2008-8-2 22:10:55 | 只看该作者
药名:司米安simian-打出来的是四面
19
发表于 2008-8-2 22:46:09 | 只看该作者
“刚试过”,我这里也是一敲就出来了。
与所用词库肯定没有关系,因为词条的颜色表明是智能组词(包括上面的那个“动态词频”词条)。不用词库,也能得出同样的结果。
20
发表于 2008-8-2 22:46:59 | 只看该作者
司米安:看来,即使勾选了“特殊解析拼音”,也必须用 ‘ 隔离simi'an 才能出来“司米安”。
21
发表于 2008-8-2 22:49:21 | 只看该作者
好奇,试了一下加加。“动态词频”、“刚试过”都能打出来。但词条的颜色表明“动态词频”是词库已有的词条。“刚试过”则是智能组词。不用词库,加加得出的是“动态次品”,而不是“动态词频”。
22
 楼主| 发表于 2008-8-3 09:11:46 | 只看该作者
原帖由 步虚 于 2008-8-2 22:46 发表
“刚试过”,我这里也是一敲就出来了。
与所用词库肯定没有关系,因为词条的颜色表明是智能组词(包括上面的那个“动态词频”词条)。不用词库,也能得出同样的结果。

请用标配语料库,就像‘你貌似”如果用标配语料库出来大就是“你茅斯”,25m也是,但是50m就行了
23
 楼主| 发表于 2008-8-3 16:00:23 | 只看该作者
想法单纯一点好----紫光出来的是:想法单纯一点号
24
发表于 2008-8-3 20:55:49 | 只看该作者
原帖由 岳家军 于 2008-8-3 16:00 发表
想法单纯一点好----紫光出来的是:想法单纯一点号

我的是默认12M的
可以正确组出
25
 楼主| 发表于 2008-8-3 21:15:01 | 只看该作者
原帖由 krsun 于 2008-8-3 20:55 发表

我的是默认12M的
可以正确组出

我替换了12兆语料库,正确了。晕倒!是不是大语料库一直没有优化过?

[ 本帖最后由 岳家军 于 2008-8-3 21:20 编辑 ]
26
发表于 2008-8-3 23:35:01 | 只看该作者
最高级语言模型库,一次成功。

Snap1.png (14.03 KB, 下载次数: 243)

Snap1.png
27
发表于 2008-8-4 14:52:35 | 只看该作者
最大语言模型库,一次正确!
28
 楼主| 发表于 2008-8-5 11:32:59 | 只看该作者
我笑某人太无聊-----------紫光出来的是:我校某人太无聊。25兆语料库。
也不能说错了,但貌似不是很常用。
29
发表于 2008-8-6 14:10:06 | 只看该作者
其实,没必要过于苛求每一个句子都不选字、词,错词、句可以通过快捷键临时删除,没有的选择一遍以后就记忆了,我觉得,目前清华紫光拼音的准确率应该是首屈一指了,当然,还要继续加油,我相信紫光拼音输入法!
30
 楼主| 发表于 2008-8-7 18:52:36 | 只看该作者
好的功能-----紫光出的是“号的功能”
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 23:54

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表