华宇拼音输入法大语言模型文件下载

野风 · 发表于 2008-7-25 18:45:14

为了方便华宇拼音输入法爱好者对于大型语言模型文件的使用，现将四哥原来发表的分散于若干个帖子中的多卷本大型语言模型文件，集中在本帖子中。为了方便大家的下载，bestdata 分三卷、welldata 分二卷、gooddata 分一卷。
追求整句准确率又不在乎几十兆硬盘空间的紫光爱好者可以根据自己的实际情况选用。
使用方法：将下载并解压后得到的 bigram.dat 复制到 "%ALLUSERSPROFILE%\Application Data\unispim6\wordlib" 下覆盖同名文件即可。
若华宇安装在c盘：
windows xp系统：相应的路径为："C:\Documents and Settings\All Users\Application Data\unispim6\wordlib" ；
windows 7 系统：相应路径为："C:\ProgramData\unispim6\wordlib" ；

注：上述文件夹为隐藏文件夹，需关闭文件夹的隐藏属性，才能找到！

bestdata：

bestdata.part1.rar (19.07 MB, 下载次数: 9497)

bestdata.part2.rar (19.07 MB, 下载次数: 8902)

bestdata.part3.rar (4.12 MB, 下载次数: 9129)
将上面三个分卷全部下载后，在同一目录下解压，得到最大语言模型文件 bigram.dat 76.9M

welldata：

welldata.part1.rar (19.07 MB, 下载次数: 5141)

welldata.part2.rar (10.88 MB, 下载次数: 4254)
将上面二个分卷全部下载后，在同一目录下解压，得到中型语言模型文件 bigram.dat 49.1M

gooddata：

gooddata.rar (16.99 MB, 下载次数: 5099)
将上面的附件下载后，解压得到最小语言模型文件 bigram.dat 24.5M

危醺客 · 发表于 2022-3-5 04:16:12

看看+1

zyfu · 发表于 2019-4-5 13:17:19

虽然是老帖子，不过总算有人登录了，有事无事都要来看看。

危醺客 · 发表于 2019-4-4 16:37:38

顶一下，期待更新！！

紫燕 · 发表于 2014-8-20 09:18:44

用一下最大的试试看！

紫光王子 · 发表于 2014-7-25 07:40:58

我一直用最大的语言模型！
很是得心应手。

Nore · 发表于 2014-7-24 22:16:38

这个有时间学习以下

lionman · 发表于 2014-7-24 07:16:13

看到论坛里有人准备自己制作语言模型文件了！

紫罗兰 · 发表于 2014-7-21 13:36:09

顶一下！
同时也期待更新——似乎是要靠做梦来实现了。

海鸥 · 发表于 2014-7-14 20:01:02

宝宝要努力发表于 2012-9-19 20:46
期待更新。

同样期待更新！

wangyanhan · 发表于 2014-7-13 00:35:16

本帖最后由 wangyanhan 于 2014-7-13 10:23 编辑

紫光要是有了笔画和构形辅助码，然后再配用大一点的好词库，就根本不需要这大的语料库了。

就是现在自身已有的超大字库，如果有了笔画和构形辅助码，也可以加速筛选速度。

在几款主流拼音输入法中，似乎只有紫光和百度没有笔画和构形辅助码了。

可惜现在没有专业班子，来打理这些重大改进呵呵！

lionman · 发表于 2014-7-12 19:35:33

看来更新语言模型是无望了……

bbc0556 · 发表于 2014-1-22 10:51:23

又换回紫光输入法了啊～～～

紫罗兰 · 发表于 2012-10-16 07:35:51

哦！我还以为是更新了呢！

野风 · 发表于 2012-10-14 16:35:46

这一楼的链接已经修复。

ljdqe · 发表于 2012-10-14 15:18:32

野风发表于 2008-7-29 16:25
本版块有这样的帖子，劳驾找一下吧！

看一下这个帖子吧：

这一楼的链接还打不开

紫罗兰 · 发表于 2012-9-29 16:01:57

支持更新！

宝宝要努力 · 发表于 2012-9-19 20:46:30

期待更新。

紫光王子 · 发表于 2012-9-19 06:58:19

进来看看！

樵夫 · 发表于 2012-9-17 07:04:45

既然来了，总是要进来看看的。

闪电王子 · 发表于 2012-9-14 15:43:44

不管更新不更新，但是梦总是有的！

IcyJuice · 发表于 2012-9-12 16:09:36

期待更新！

樵夫 · 发表于 2012-9-12 07:09:47

进来看看……

紫罗兰 · 发表于 2012-9-9 12:02:35

等的花儿都谢了。期待死了
admin03 发表于 2012-9-1 09:17

是的！

lionman · 发表于 2012-9-8 09:08:15

期待更新中……

紫光王子 · 发表于 2012-9-5 23:05:07

看来语言模型的更新是赶不上新版的发布了。

野风 · 发表于 2012-9-5 16:19:27

回复 168# 派司

因为更新语言模型的数据量很大，所以更新语言模型还是有一定难度的。

闪电王子 · 发表于 2012-9-4 06:25:06

应该说：语言模型再好一些，词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音 ...
野风发表于 2012-9-1 13:05

正确！

樵夫 · 发表于 2012-9-3 19:28:44

应该说：语言模型再好一些，词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音 ...
野风发表于 2012-9-1 13:05

支持！

野风 · 发表于 2012-9-1 13:05:13

应该说：语言模型再好一些，词库的容量就可以再小一些。
这样对提高输入法的响应速度是有利的。
加加拼音因智能性不高，所以只能靠加大词库的容量来弥补。
所以老紫光用户是不用很大的词库的。
现在论坛里喜欢用大词库的，基本上都是从加加转过来的网友。

wangyanhan · 发表于 2012-9-1 13:01:28

词库大一点，要不要大语言模型库就无所谓了。

		自动登录	找回密码
密码			注册

华宇拼音输入法大语言模型文件下载

点评

浏览过的版块