华宇拼音输入法论坛

标题: 我觉得紫光词库应该开放! [打印本页]

作者: jarenwen    时间: 2013-4-14 16:11
标题: 我觉得紫光词库应该开放!
本帖最后由 jarenwen 于 2013-4-14 16:20 编辑

这个论坛提供的紫光词库,都是紫光输入法格式文件的词库,不能打开,不能修改。
这点很不好,我觉得紫光的这种做法太狭隘了,太小气了。
在加加论坛,古陶瓦先生的词库都是开放式的txt格式词库,任何人都可以下载修改。
虽然紫光在规范化词库这方面的做的很好,很负责任。
但是,无论如何,提供一个固定了不能修改的词库,无法满足不同用户的需求。而且,无法保证里面没有废词、措词和非词。
如果一个开放式的词库,用户就可以删除里面的不需要词,加进自己需要的词。并且能够挑出一些有疑问的词(疑是错词、非词)放到论坛上来讨论,让词库更加精华。毕竟,靠一两个人去辨识一个庞大词库的真伪,是能力有限的。

我这两天在本论坛发帖,就有许多常用词组打不出来。比如今天用到的【疑是】一词,就没有。
也许紫光是出于商业保密,对词库加密——你这手段,只能是对付普通用户。对于搜狗、QQ等,他们是有能力解密你的词库文件的。因此,你这做法没有任何实际意义。

作者: 紫光蓝天    时间: 2013-4-14 16:40
加加的系统词库以及多数词库也是打不开的
如果一个词库不能打开,你会觉得她神秘
一旦打开了,就觉得没那么神秘了

作者: 紫光蓝天    时间: 2013-4-14 22:17
古陶瓦的加加词库,那几个经典的全部是加密的。
古陶瓦的紫光词库,那几个也全部是加密的
作者: 紫光蓝天    时间: 2013-4-14 22:39
本论坛上的词库,是否加密,都是作者自己设定的。
如果你能为输入法做个不加密的词库,也是非常欢迎的
作者: 紫光蓝天    时间: 2013-4-15 00:29
jarenwen  ——那是古大师用紫光格式发布的词库,并非古大师有意要加密。因为他的20万,25万词库是txt格式,并没加密。

回答:不是这样的,紫光格式可选择加密和不加密,那的确是古大师有意加密的。在加加上虽然有不加密的,可是他的精品词库都是加密的。
作者: 紫光蓝天    时间: 2013-4-15 00:54
说实在的,紫光格式的词库可以加密,这也是一个优点呢。
如果不能够加密,古大师是不会舍得把他的词库拿到论坛的
作者: kingdick    时间: 2013-4-15 07:48
词库提供加密功能,是为词库作者多了一种选择。加密的词库并不是官方非要这么做的,而是作者的意图。就算搜狗等输入法,他们的词库都是开放的吗?
作者: jarenwen    时间: 2013-4-15 10:32
本帖最后由 jarenwen 于 2013-4-15 10:35 编辑

【筚路蓝缕】不规范
规范的用词是【筚路褴褛】
我使用的是紫光输入法,近期下载的是近期更新的【野风精确词库】和【野风系统词库】。词库中只有【筚路蓝缕】而无【筚路褴褛】。而词库中却只有【褴褛】而无【蓝褛】——也就是说紫光词库收入了不规范的【筚路蓝缕】这个词。





【筚路蓝缕】这个词,可能来源于第二批异形词整理表(草案),这个词应该是针对【荜路蓝缕】这个异形词来整理的。但殊不知,【筚路蓝缕】这个词本身就不规范。

看看字典怎么说:
《现代汉语词典》(第五版)收【筚路蓝缕】为解释词,【荜路蓝缕】为推荐词。但是,它又收【褴褛】为解释词,【蓝褛】为推荐词。——也就是说,《现代汉语词典》对这个问题都是左右摇摆,前后矛盾。
不知道《现汉》第六版是否改进过来了?

再来看看《现代汉语规范字典》怎么说:




【蓝褛】,从字面解释就是【蓝色的衣服】——这跟破烂有什么关系?

所以说,紫光加密词库,不加分析,太过自负并非好事。

作者: Loquat-Honey    时间: 2013-4-15 10:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: 敝邑    时间: 2013-4-16 14:37
jarenwen 发表于 2013-4-15 10:32
【筚路蓝缕】不规范
规范的用词是【筚路褴褛】
我使用的是紫光输入法,近期下载的是近期更新的【野风精确 ...



过几天我会提供我的词库

但是词库数据我会加密

到时楼主可以使用

作者: 野风    时间: 2013-4-16 20:15
jarenwen 发表于 2013-4-15 10:32
【筚路蓝缕】不规范
规范的用词是【筚路褴褛】
我使用的是紫光输入法,近期下载的是近期更新的【野风精确 ...


不错!
对于异形词,本人的依据就是《第二批异形词整理表(草案)》。凡事总有一个标准,众口纷纭,终究莫衷一是。
查了一下《现汉》第六版,“筚路蓝缕”仍是推荐词条,有“荜路蓝缕”词条,但注明同“筚路蓝缕”。所以继续采用“筚路蓝缕”。以跟规范保持一致。
作者: 野风    时间: 2013-4-16 20:18
Loquat-Honey 发表于 2013-4-15 10:54
个人版权、知识产权方面的考虑,词库不开放绝对赞同。尤其是那些很有个人收集特色和质量较高的词库。此事没 ...


1.不好意思,本人的词库,是适合以单字和词来输入的,所以不考虑组合问题;
2.本人的词库力求准确,如能做到跟字典一样,那是我梦寐以求的,只是距离这个目标还很远……也正是因为厌倦了官方词库的众多不符合国家相关规范的词,才在四年前开始整理适合自己的词库的。
作者: Loquat-Honey    时间: 2013-4-16 20:53
提示: 作者被禁止或删除 内容自动屏蔽
作者: 野风    时间: 2013-4-16 21:54
标题: RE: 我觉得紫光词库应该开放!
Loquat-Honey 发表于 2013-4-16 20:53
华宇上屏速度受词库多少影响这没有疑问吧,


这点还真有疑问!
在我的电脑上就从来没有过!可能是我的电脑配置比较高吧?
作者: 紫光蓝天    时间: 2013-4-16 22:13
华宇和加加的上屏速度,不能一概而论:
小词库:华宇快
超大词库:加加快

作者: wangyanhan    时间: 2013-4-17 21:23
华宇的加密词库也是可以全部导出来的,只是词频全没了,这算不算点技巧啊?!^_^
作者: Loquat-Honey    时间: 2013-4-24 12:36
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2