华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 17099|回复: 1
打印 上一主题 下一主题

自建词库怎样这么大?

[复制链接]
跳转到指定楼层
1
发表于 2021-6-3 19:23:07 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
6k的文本创建成uwl词库(110kB),居然大了20倍。希望能够优化一下。
2
 楼主| 发表于 2021-6-5 13:28:43 | 只看该作者
https://www.cnblogs.com/studyzy/archive/2012/03/01/2375542.html
4.紫光分类词库uwl格式

uwl格式的词库并不是很多,所以我现在还不支持对该词库格式的转换,但是使用了WinHex大概看了下,该格式的词库和scel也比较类似,没有使用压缩,但是编码上好像UTF8和Unicode的都有,词条之间的距离很稀疏,也就是说在文件中,词条和词条间有很多0000,实在是浪费空间。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-24 02:26

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表