华宇拼音输入法论坛
标题:
txt 文件作为词库导入的 要求?
[打印本页]
作者:
ttami
时间:
2008-2-29 16:31
标题:
txt 文件作为词库导入的 要求?
作为词库导入的txt文件有没有什么要求?
我分析了三类一般称为 词库的txt文件,一类是完全注音,一类是只对于多音字注音,一类是简单的罗列词语,没有主音。
紫光能导入的txt就是第一类,其他都不能成功导入。能不能像 拼音加加 那样可以导入第三类的txt文件呢?
我觉得 在词库方面
拼音加加还是稍微 功能比紫光强的。
我观察了一下,紫光 词库管理 中 能导入的txt文件,里面必须是 这样的
第一类:
来了laile
那个人 nageren
难道 nandao
那样 nayang
路由 luyou
而 第二类就是这样:
来了le
那na个人
难道
那na样
路由
两根针
全新
十五
西安
吸引
允许
在我
在于
还hai要
快乐le
学会hui
改善
化工
第三类是这样的:
矮地茶
狼毒
芦荟
牛黄
罗汉果
莱菔子
莲房
莲花
蓝花参
芦根
了哥王
肉桂
老鹳草
作者:
xfp
时间:
2008-2-29 17:57
可以自动生成拼音的啊,然后导入不就行了
作者:
hualuoqu
时间:
2008-2-29 19:37
自动生成拼音对多音字来说比较难办吧。
作者:
kingdick
时间:
2008-2-29 20:03
楼主说的可以说是对多音字导入词库的一种解决方式。
作者:
ttami
时间:
2008-3-3 11:36
标题:
我说的就是
紫光6.0 里面无法对 第三类txt文件进行导入
而第三类txt词库文件是最常见的。
不过我今天发现我用原来的 紫光 3.0那个版本里面
词库管理--从定义文本中导入新词--
那个就可以成功的导入那种 没有注音的txt文本,还成功导入了1万多条数据
所以现在来看就是 紫光6.0版本 不可了。
作者:
ttami
时间:
2008-3-3 11:39
标题:
看到这个图
我印象中 我正是用了 导入
那么我应该用创建?
紫光搞那么复杂 干什么?
有没有紫光的热门论坛或者qq群?
这里算是紫光讨论最好的论坛吗?
这里有紫光的创作人员吗?
[
本帖最后由 ttami 于 2008-3-3 11:42 编辑
]
作者:
krsun
时间:
2008-3-3 12:45
较之以前的版本,紫光6.0以后的版本的词库结构是经过全新设计的。它与以前的3.0/5.0不兼容。目前紫光还没有一套比较令人满意的词库管理工具,期待后续版本推出。
目前你可以使用创建功能解决注音问题,把系统注音后的文本文件保存为其它名称,再行导入。
感觉对于比较专业的词汇应该导入到相应的专业词库中,不宜全部都导入到紫光的用户词库中。
紫光的导入工具应该将非多音字词直接导入相应的词库,对于多音字词应该提供一个工具列出全部可能的拼音组合让用户选择正确的读音。
作者:
ttami
时间:
2008-3-5 15:09
标题:
krsun,你的回答很专业,但是表述的不太清晰
我昨天做了试验
创建功能 是可以创造一个新的词库,对于txt文件,里面如果没有注音,经过创建过程,是可以产生注音,但是对于多音字词确实无法正确导入,好像对于没有注音的词是无法导入。。。忘记了
导入功能,是导入txt到现成的一些词库中,也可以产生注音,
而用批量造词,更加有明显的结果表现出来,然后再选择 生成的词语导入。。
我已经不明白我当初怎么 觉得 一个没有注音 的txt词库文件,无法正确导入。。。诶。。
作者:
krsun
时间:
2008-3-5 18:33
是我没有记清楚,应该是利用批量造词自动生成注音。
作者:
www1www
时间:
2008-3-6 09:00
QQ拼音1.1beta2,可以将楼主的第三类格式作为分类词库导入!
欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/)
Powered by Discuz! X3.2