为了方便华宇拼音输入法爱好者对于大型语言模型文件的使用,现将四哥原来发表的分散于若干个帖子中的多卷本大型语言模型文件,集中在本帖子中。为了方便大家的下载,bestdata 分三卷、welldata 分二卷、gooddata 分一卷。
追求整句准确率又不在乎几十兆硬盘空间的紫光爱好者可以根据自己的实际情况选用。
使用方法:将下载并解压后得到的 bigram.dat 复制到 "%ALLUSERSPROFILE%\Application Data\unispim6\wordlib" 下覆盖同名文件即可。
若华宇安装在c盘:
windows xp系统:相应的路径为:"C:\Documents and Settings\All Users\Application Data\unispim6\wordlib" ;
windows 7 系统:相应路径为:"C:\ProgramData\unispim6\wordlib" ;
注:上述文件夹为隐藏文件夹,需关闭文件夹的隐藏属性,才能找到!
bestdata:
bestdata.part1.rar
(19.07 MB, 下载次数: 8899)
bestdata.part2.rar
(19.07 MB, 下载次数: 8322)
bestdata.part3.rar
(4.12 MB, 下载次数: 8516)
将上面三个分卷全部下载后,在同一目录下解压,得到最大语言模型文件 bigram.dat 76.9M
welldata:
welldata.part1.rar
(19.07 MB, 下载次数: 4517)
welldata.part2.rar
(10.88 MB, 下载次数: 3715)
将上面二个分卷全部下载后,在同一目录下解压,得到中型语言模型文件 bigram.dat 49.1M
gooddata:
gooddata.rar
(16.99 MB, 下载次数: 4540)
将上面的附件下载后,解压得到最小语言模型文件 bigram.dat 24.5M
|