华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 295662|回复: 199
打印 上一主题 下一主题

华宇拼音输入法大语言模型文件下载

  [复制链接]
跳转到指定楼层
发表于 2008-7-25 18:45:14 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
为了方便华宇拼音输入法爱好者对于大型语言模型文件的使用,现将四哥原来发表的分散于若干个帖子中的多卷本大型语言模型文件,集中在本帖子中。为了方便大家的下载,bestdata 分三卷、welldata 分二卷、gooddata 分一卷。
追求整句准确率又不在乎几十兆硬盘空间的紫光爱好者可以根据自己的实际情况选用。
使用方法:将下载并解压后得到的 bigram.dat 复制到 "%ALLUSERSPROFILE%\Application Data\unispim6\wordlib" 下覆盖同名文件即可。
若华宇安装在c盘:
windows xp系统:相应的路径为:"C:\Documents and Settings\All Users\Application Data\unispim6\wordlib"
windows 7 系统:相应路径为"C:\ProgramData\unispim6\wordlib"

注:上述文件夹为隐藏文件夹,需关闭文件夹的隐藏属性,才能找到!

bestdata:

bestdata.part1.rar (19.07 MB, 下载次数: 8899)



bestdata.part2.rar (19.07 MB, 下载次数: 8322)


bestdata.part3.rar (4.12 MB, 下载次数: 8516)

将上面三个分卷全部下载后,在同一目录下解压,得到最大语言模型文件 bigram.dat 76.9M


welldata:
welldata.part1.rar (19.07 MB, 下载次数: 4517)


welldata.part2.rar (10.88 MB, 下载次数: 3715)
将上面二个分卷全部下载后,在同一目录下解压,得到中型语言模型文件 bigram.dat 49.1M


gooddata:
gooddata.rar (16.99 MB, 下载次数: 4540)
将上面的附件下载后,解压得到最小语言模型文件 bigram.dat 24.5M




199
发表于 2022-3-5 04:16:12 | 只看该作者
看看+1
198
发表于 2019-4-5 13:17:19 | 只看该作者
虽然是老帖子,不过总算有人登录了,有事无事都要来看看。
197
发表于 2019-4-4 16:37:38 | 只看该作者
顶一下,期待更新!!
196
发表于 2014-8-20 09:18:44 | 只看该作者
用一下最大的试试看!
195
发表于 2014-7-25 07:40:58 | 只看该作者
我一直用最大的语言模型!
很是得心应手。
194
发表于 2014-7-24 22:16:38 | 只看该作者
这个有时间学习以下
193
发表于 2014-7-24 07:16:13 | 只看该作者
看到论坛里有人准备自己制作语言模型文件了!
192
发表于 2014-7-21 13:36:09 | 只看该作者
顶一下!
同时也期待更新——似乎是要靠做梦来实现了。
191
发表于 2014-7-14 20:01:02 | 只看该作者
宝宝要努力 发表于 2012-9-19 20:46
期待更新。


同样期待更新!
190
发表于 2014-7-13 00:35:16 | 只看该作者
本帖最后由 wangyanhan 于 2014-7-13 10:23 编辑

紫光要是有了笔画和构形辅助码,然后再配用大一点的好词库,就根本不需要这大的语料库了。

就是现在自身已有的超大字库,如果有了笔画和构形辅助码,也可以加速筛选速度。

在几款主流拼音输入法中,似乎只有紫光和百度没有笔画和构形辅助码了。

可惜现在没有专业班子,来打理这些重大改进呵呵!

189
发表于 2014-7-12 19:35:33 | 只看该作者
看来更新语言模型是无望了……
188
发表于 2014-1-22 10:51:23 | 只看该作者
又换回紫光输入法了啊~~~
187
发表于 2012-10-16 07:35:51 | 只看该作者
哦!我还以为是更新了呢!
186
 楼主| 发表于 2012-10-14 16:35:46 | 只看该作者
这一楼的链接已经修复。
185
发表于 2012-10-14 15:18:32 | 只看该作者
野风 发表于 2008-7-29 16:25
本版块有这样的帖子,劳驾找一下吧!

看一下这个帖子吧:

这一楼的链接还打不开

点评

http://bbs.unispim.com/forum.php?mod=viewthread&tid=2697&extra=  发表于 2012-10-14 15:45
184
发表于 2012-9-29 16:01:57 | 只看该作者
支持更新!
183
发表于 2012-9-19 20:46:30 | 只看该作者
期待更新。
182
发表于 2012-9-19 06:58:19 | 只看该作者
进来看看!
181
发表于 2012-9-17 07:04:45 | 只看该作者
既然来了,总是要进来看看的。
180
发表于 2012-9-14 15:43:44 | 只看该作者
不管更新不更新,但是梦总是有的!
179
发表于 2012-9-12 16:09:36 | 只看该作者
期待更新!
178
发表于 2012-9-12 07:09:47 | 只看该作者
进来看看……
177
发表于 2012-9-9 12:02:35 | 只看该作者
等的花儿都谢了。期待死了
admin03 发表于 2012-9-1 09:17


是的!
176
发表于 2012-9-8 09:08:15 | 只看该作者
期待更新中……
175
发表于 2012-9-5 23:05:07 | 只看该作者
看来语言模型的更新是赶不上新版的发布了。
174
 楼主| 发表于 2012-9-5 16:19:27 | 只看该作者
回复 168# 派司

因为更新语言模型的数据量很大,所以更新语言模型还是有一定难度的。
173
发表于 2012-9-4 06:25:06 | 只看该作者
应该说:语言模型再好一些,词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音 ...
野风 发表于 2012-9-1 13:05

正确!
172
发表于 2012-9-3 19:28:44 | 只看该作者
应该说:语言模型再好一些,词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音 ...
野风 发表于 2012-9-1 13:05


支持!
171
 楼主| 发表于 2012-9-1 13:05:13 | 只看该作者
应该说:语言模型再好一些,词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音因智能性不高,所以只能靠加大词库的容量来弥补。
所以老紫光用户是不用很大的词库的。
现在论坛里喜欢用大词库的,基本上都是从加加转过来的网友。
170
发表于 2012-9-1 13:01:28 | 只看该作者
词库大一点,要不要大语言模型库就无所谓了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-24 04:15

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表