华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 24032|回复: 22
打印 上一主题 下一主题

官方的成语词库有必要安装吗?

[复制链接]
cool2k 该用户已被删除
跳转到指定楼层
1
发表于 2007-11-21 15:13:52 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
2
发表于 2007-11-21 15:15:04 | 只看该作者
就看你需要不需要了!
cool2k 该用户已被删除
3
 楼主| 发表于 2007-11-21 15:17:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
4
发表于 2007-11-21 15:18:26 | 只看该作者
常用的成语(词频高的)已经收录在系统词库中了,大约有接近七八千条;除非您文辞精妙,常常引经据典,否则,不用也可以。
5
发表于 2007-11-21 15:19:43 | 只看该作者
原帖由 ZXD4G 于 2007-11-21 15:18 发表
常用的成语(词频高的)已经收录在系统词库中了,大约有接近七八千条;除非您文辞精妙,常常引经据典,否则,不用也可以。


还是四哥答得专业!o(∩_∩)o
cool2k 该用户已被删除
6
 楼主| 发表于 2007-11-21 15:20:38 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
7
发表于 2007-11-21 15:40:30 | 只看该作者
原帖由 野风 于 2007-11-21 15:19 发表


还是四哥答得专业!o(∩_∩)o

客气了,非”专业“也,只是身为主要编撰者,比大家熟悉些内幕而已。
8
发表于 2007-11-21 15:57:22 | 只看该作者
要是用了我的紫光词库完美优化第五版,就更不要用其它成语词库了.第五版中的成语都是精校过的.
cool2k 该用户已被删除
9
 楼主| 发表于 2007-11-21 16:01:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
10
发表于 2007-11-21 16:40:51 | 只看该作者
原帖由 cool2k 于 2007-11-21 16:01 发表
用了紫光词库完美优化第五版后,
还有必要使用安装V6时自带的系统词库及天文地理、生活、古今中外各界人名、娱乐词库吗?

系统词库应该没必要了.其它词库可以勾选.
11
发表于 2007-11-21 17:15:42 | 只看该作者
我整个就一个用户词库,还是自己组的词来的顺手
主要是感觉大词库里面有很多一辈子都可能用不到的词
12
发表于 2007-11-21 19:44:15 | 只看该作者
原帖由 xfp 于 2007-11-21 17:15 发表
我整个就一个用户词库,还是自己组的词来的顺手
主要是感觉大词库里面有很多一辈子都可能用不到的词


嘿嘿……

13
发表于 2007-11-23 00:07:03 | 只看该作者
原帖由 xfp 于 2007-11-21 17:15 发表
我整个就一个用户词库,还是自己组的词来的顺手
主要是感觉大词库里面有很多一辈子都可能用不到的词


同感哈
14
发表于 2007-11-23 08:21:37 | 只看该作者
我用紫光2.3~3.0大约4年的时间,当时的词库容量号称8万,去除单字后大约6万。当时经常要频繁地造词,造词受二字词影响很大,个别二字词的重码较多时,造词效率会降低。昨天在加加论坛谈到这个问题,认为大词库中的二字词应该进一步缩减,主要是那些重码较多的,应删除废词和部分低频词。这样的词库结构似乎更合理一些。
现在的V6版加上了简拼功能,但还不完善(双拼时),三字词、四字词的影响有多大?应和以前的使用体验应有所不同吧?提出来供讨论。
15
发表于 2007-11-23 10:02:10 | 只看该作者
很有些启发,于是感悟:软件功能和词库构成之间存在着一种双向反馈机制,两个方面的发展需要一些协同。
目前的V6系统词库中,根据构成词的字数来圈定成分,是以下一组数字:
02 101057
03   77575
04   77785
05     9212
06     3893
07     2143
08       608
……
应该看到,二字词还是最多的,应该还存在较多不那么常用的词,似乎可以模仿成语那样处置,保留常用的在系统库,其它的单独做一个分类库,谁需要,谁下载,谁勾选,可能要好一些。
四字词中要是把不常用的成语也算进来,总数是超过二字词的。
16
发表于 2007-11-23 10:05:05 | 只看该作者
接上帖,谈谈软件功能,个人觉得主要有两项与词库构成关系比较密切:
1.简拼模式
重码不高的长词,用简拼是很有效的,引入通配符,又多了一种手段,好像暗示我们,在拼音输入法的词库中,长词再多一些,也无妨
2.组词能力
当前版本的智能组词,在全拼模式下,约有1/3的准确性,尚不足以下决心对长词进行过多裁剪,是裁剪了一部分,但也保留了很多,这对于以词为单位的输入习惯,是件好事

智能组词的能力也在不断改进,要是有那么一天,全拼准确率上升到2/3以上,则培养一下整句输入的习惯也不错,假使能够使得简拼模式的智能组词效果超过1/2,再来精简一下长词也是好的。
17
发表于 2007-11-23 10:12:25 | 只看该作者
原帖由 xfp 于 2007-11-21 17:15 发表
我整个就一个用户词库,还是自己组的词来的顺手
主要是感觉大词库里面有很多一辈子都可能用不到的词


你真狠啊!

刚开始使用时,很多词语出不来,那不是很麻烦?如果你的词库有一定积累的话,那问题倒是不大。
18
发表于 2007-11-23 10:15:02 | 只看该作者
原帖由 xfp 于 2007-11-21 17:15 发表
我整个就一个用户词库,还是自己组的词来的顺手
主要是感觉大词库里面有很多一辈子都可能用不到的词


不过,你给了我一定 的启发。确实,在我看来,我们常用的词语也就那么几个,大概五六千吧?绝大多数,可能真的一辈子也用不到。

可惜系统词库和大词库无法修改,不然的话,真的可以把所有词库整合起来,然后剔除大多数自己并不需要的词汇,真正做到为我所用。

[ 本帖最后由 ShingU 于 2007-11-23 10:16 编辑 ]
19
发表于 2007-11-23 10:55:44 | 只看该作者
兄弟,轻易不要动这个念头吧。
整合后的词库,总数有三十好万条,自己来精校,体力活儿绝对不是你现在脑子一热就能掂量清楚的,而且,个人的语言习惯也在动态发展中,没准儿你今天剔除了,将来要后悔。

以yaclear的热情和坚忍,每天投入3个多小时,历时已达两三个月,50多万条的词库,目前进度也就20%上下。

让广大用户投入太多,应该是输入法开发者的失败,也严重违背了节约型社会的宗旨。

当然,如果你十分坚定地要求这么干才能更爽,咱可以从更大程度上支持你,譬如,适当时候解封词库,或者直接向你提供整合后的词库,再提供一些实用工具之类的。
本来也想发布一些工具的,只是这些工具有十几个,这些天想再优化和整合一下,形成一个程序。
20
发表于 2007-11-23 11:08:52 | 只看该作者
  我揣摩楼主提问的本意不是他决定不下要不要安装成语词库,而是单独搞一个成语词库有没有必要。
  对于不是专门研究成语的人来说,专门的成语词库确实没有必要。如专业成语词库有“阿匼取容”这个词语,我想只有编成语词典的人才会用到!
  因此建议开发组和fengyu29在编辑系统大词库时将商务版的成语小词典中的成语收录进去即可。
  近来四哥对紫光词库的构建较为重视,对构建词库的思路也相当清晰,相信能照顾绝大多数用户的真正完美系统词库指日可待。但有一点不得不说,系统词库中的专业词条收到哪个层次没有明确和落实、分类词库没有全部建立之前,系统词库的真正完美还是相当困难。
21
发表于 2007-11-23 11:17:45 | 只看该作者
原帖由 sanwsw 于 2007-11-23 11:08 发表
但有一点不得不说,系统词库中的专业词条收到哪个层次没有明确和落实、分类词库没有全部建立之前,系统词库的真正完美还是相当困难。

精辟,确是相当困难。
22
发表于 2011-11-16 18:55:58 | 只看该作者
你要是玩成语接龙游戏就有必要装
紫光的成语词库非常全面
23
发表于 2011-12-13 08:47:19 | 只看该作者
四字词空码太多,个人认为使用大成语词库很有必要

[ 本帖最后由 紫光蓝天 于 2011-12-13 08:53 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 07:46

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表