华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 15114|回复: 5
打印 上一主题 下一主题

紫光拼音6.8版里导入用户词库的时候遇到问题,无法导入长一点的句子。。。。

[复制链接]
跳转到指定楼层
1
发表于 2012-1-21 10:23:13 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
在6.8版里导入用户词库的时候出现一个提示框:第XX行拼音超过64字符的限制

看上去词库是导入进去了,但是不知道是不是删除了啥内容。在就是不知道以后使用的时候会不会有影响?

遇到这样的问题该怎么处理?

知道的给解答一下。谢谢。。



我试着输入了几个长句子,当中经过修改个别的不适合字后组成了一个长句子,这个句子在用户词库里形成了此条。而且能正常使用。

将用户词库导出来后,选择清空用户词库后,再次导入刚刚导出的这个词库的时候就提示:第XX行拼音超过64字符的限制

然后就自动把这个长句子自动删除了。


这个应该是紫光拼音6.8版本自身问题了吧?

[ 本帖最后由 ddr 于 2012-1-21 21:22 编辑 ]
2
发表于 2012-1-21 11:14:53 | 只看该作者
下面是紫光批量造词工具的说明:
# 《紫光华宇拼音输入法》文本词条注音、检查和词库导入工具......
#
# 一、约定字符和文本词条格式
# ⑴ <空白符>:支持2个字符,分别是<TAB>和空格(ASCII为0x09和0x20)
# ⑵ <注释符>:支持2个字符,分别是"#"号和分号(ASCII为0x23和0x3B)
#    以“注释符”开头的行在处理中将被忽略,不予处理;如本说明
# ⑶ <切分符>:用于拼音串的多音节分割处理,英文单引号(ASCII为0x39)
# ⑷ 文本词条格式:词语串<空白符>拼音串<空白符>词频串
#    用户原始文本中的“空白符”可以连续多个,但处理后将格式化为一个<TAB>
# 二、文本词条各列说明
# ⑴ 词语串:可由最多32个非ASCII字符组成,但有拼音的字符数不能少于2个
#    当前输入法收录了26000余字的拼音,因多音字之故,字音条目已愈32000
#    并非所有75000多个字符都允许用来构词,造词允许的字符须在unicode
#    基本位平面之内,即CJK Ext-B、Ext-C中的字符暂不允许构词
# ⑵ 拼音串:由词语串中各字符的拼音连接而成,通过“切分符”进行分割
# ⑶ 词频串:应由纯数字字符组成,且转为数值后,区间应为[0,524287]
#    若该串构成不符合要求或数值越界,则词频设为缺省值——100000(十万)
# 三、其它说明
# ⑴ 如果仅提供“词语串”,则为这个词生成拼音,且词频取用缺省值——十万
# ⑵ 如果提供了“拼音串”,则对这个串进行检查,不正确时,将重新生成拼音
#    若需重新生成,而词语中有多音字,且本工具未能决定拼音的,需人工编辑
# ⑶ 当“词语串”中包含的汉字多于8个时,缺省产生前八个汉字的拼音连接串
#    若追求完美,可以手工补足;输入音节较多的词语,推荐“通配符*”功能
#    若追求精简,可以手工裁剪,最少可缩减至5个音节
;
# 示例如下,您可以手工删掉“注释符”,执行“生成/检查拼音”功能获得体验
;中国人       zhong'guo'ren        345678
;紫光华宇     ZGHY
;《红楼梦》
;《安娜·卡列尼娜》        an'na'ka'lie'ni'na        100
;阿里克谢·马克西·莫维奇·彼什科夫    a'li'ke'xie'ma'ke'xi   90
;两个黄鹂鸣翠柳,一行白鹭上青天,窗含西岭千秋雪,门泊东吴万里船        liang'ge'huang'li'ming        88
#

应该是紫光对词库的拼音编码有限制,超过的就应该是自动截取了。应该不影响输入,建议长句输入时可以适当应用通配符(*)。
3
 楼主| 发表于 2012-1-21 20:17:22 | 只看该作者
我试着输入了几个长句子,当中经过修改个别的不适合字后组成了一个长句子,这个句子在用户词库里形成了此条。而且能正常使用。


将用户词库导出来后,选择清空用户词库后,再次导入刚刚导出的这个词库的时候就提示:第XX行拼音超过64字符的限制


然后就自动把这个长句子自动删除了。



这个应该是紫光拼音6.8版本自身问题了吧?
4
发表于 2012-1-21 20:19:21 | 只看该作者
紫光6.8版对导入词条的拼音串的长度做了限制,拼音字符不能超过64个。
5
 楼主| 发表于 2012-1-21 21:19:13 | 只看该作者
原帖由 野风 于 2012-1-21 20:19 发表
紫光6.8版对导入词条的拼音串的长度做了限制,拼音字符不能超过64个。



这限制不好哦。限制了长句子功能哦。有些诗词的长句子就不能保存到用户词库了哦

那个拼音加加能输入很长的句子哦。

能输入长句子是是优势,貌似也是输入法以后的趋势。

[ 本帖最后由 ddr 于 2012-1-21 21:20 编辑 ]
6
发表于 2012-2-1 10:26:56 | 只看该作者
同意二楼的说法,长句输入建议使用通配符

如果需要经常输入诗词,建议加载相应的诗词词库
如果需要从导出的用户词库中导入长句,建议把相关条目手工复制粘贴到批量造词工具里面,然后编辑拼音串使之符合64字符的限制(其实完全可以只导入长句本身,由工具自动生成拼音串和词频串)。全拼最长应该是6码一个音节吧,64字符意味着超过十个字了,这种情况下估计不存在什么重码问题,后面的拼音串完全可以忽略

顺便一提,紫光支持长句输入,但其定位还是侧重于词语、短语和短句输入的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 07:47

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表