华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 13402|回复: 16
打印 上一主题 下一主题

我想问一下屏蔽掉的词怎样恢复

[复制链接]
跳转到指定楼层
1
发表于 2008-11-17 05:25:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
各位工作人员好!

我想问一下,用 Ctrl+D 或 Crtl+Num 屏蔽掉的系统词库(非用户词库)的词组后,怎样对其恢复呢。
或者怎样直接屏蔽这个功能呢?

另外我发现:
%AppData%\unispim6\wordlib\ci_cache.dat
这个文件里面记录了用户输入过的词组,无论是用户造的词,还是用户造错已经删除的词。

还有%AppData%\unispim6\wordlib\user.uwl
这个应该是用户词库文件吧?可是用户错造的词里面还是有记录,会不会因此产生太多冗余数据呢。

%ALLUSERSPROFILE%\Application Data\unispim6\wordlib\new_ci.dat
这个应该是同步词库时递交给官方的用户自定义词组?


因为我是从v3走过来的,以前我都是直接备份 %USERPROFILE%\Application Data\ 下紫光的配置目录,现在换到新版,看见这些,有点迷惑。

同时我希望紫光能够推出一个备份词频的功,貌似那个S开头的输入法这方面做得比较好,可以借鉴一下??

[ 本帖最后由 imyours 于 2008-11-17 09:15 编辑 ]
2
 楼主| 发表于 2008-11-24 14:44:32 | 只看该作者
这个帖不是一般的冷啊

[ 本帖最后由 imyours 于 2008-12-3 03:41 编辑 ]
3
发表于 2008-12-5 08:11:40 | 只看该作者
1、第一个问题,我从来没有想过。因为我不是这样处理非用户词库的,当发现非用户词库有错词时,是用直接编辑的方法来删除的,也就不存在恢复不恢复的问题了。至于屏蔽这个功能,至少目前无法通过设置的方法来解决。

2、
%AppData%\unispim6\wordlib\ci_cache.dat
这个文件里面记录了用户输入过的词组,无论是用户造的词,还是用户造错已经删除的词。

还有%AppData%\unispim6\wordlib\user.uwl
这个应该是用户词库文件吧?可是用户错造的词里面还是有记录,会不会因此产生太多冗余数据呢。

同感!以前没有注意到,今天我把它的内容清除了,现在好像还是能正常使用。但不知删除后会怎么样。有机会时再试一下。user.uwl 是用户词库,包含了你所有的自造的新词,若你勾选过“将用户使用过的词汇记录到用户词库中”的话,则包含了你所有使用过的词汇。

3、
%ALLUSERSPROFILE%\Application Data\unispim6\wordlib\new_ci.dat
这个应该是同步词库时递交给官方的用户自定义词组?

这个不清楚,须官方解释。

4、
同时我希望紫光能够推出一个备份词频的功,貌似那个S开头的输入法这方面做得比较好,可以借鉴一下??

现在的版本,有了一个备份的功能了,备份时,包含了用户词库和字频、词频等。
这么长时间未回复,主要原因还是对你提出的问题,不是很明了,包括现在。本想问过左总后,再回复,看到你上面的帖子,只好先草草回复一下了。(左总现在很忙,正在冲刺新版本,不好打扰他)

赞一下,你的这几个问题都很有深度!

4
发表于 2008-12-5 09:39:13 | 只看该作者
先前的帖子中zxd4g提过输入法对于用户删除错误词组的处理办法,那就是只是对这些词打上标识屏闭,并不彻底删除。这样做的初衷是防止用户误删,减少对于输入法词库文件频繁的写操做,增强数据文件的稳定性。
删除的词要重新回来,最简单的办法就是重新输入一边。看你对于输入法也是非常透彻的人,你既然知道用户词库文件在哪里,里面存了哪些词,说明你已经看到这些词了。那就以文本词库导入既可恢复。
对于词频如果需要,可以考虑在后续添加上。
5
发表于 2008-12-5 10:07:43 | 只看该作者
%AppData%\unispim6\wordlib\ci_cache.dat
这个文件里面记录了用户输入过的词组,无论是用户造的词,还是用户造错已经删除的词。

还有%AppData%\unispim6\wordlib\user.uwl
这个应该是用户词库文件吧?可是用户错造的词里面还是有记录,会不会因此产生太多冗余数据呢。


将上面这个文件删除,重启后,这个文件会自动生成。ci_cache.dat 大小恢复到删除前状态。将ci_cache.dat内容清空后保存,。输入法使用后,似乎文件大小也没有增加,不知重启后会否增加。将继续跟踪这个文件。
楼主若担心user.uwl 会产生大量的冗余数据,可以不勾选“将用户使用过的词汇记录到用户词库中”的选项,用户词库将只记录用户新造的词。

6
发表于 2008-12-5 10:09:20 | 只看该作者
第一条,如果是系统词库,野风怎么直接编辑呢?

7
发表于 2008-12-5 10:14:51 | 只看该作者
原帖由 krsun 于 2008-12-5 10:09 发表
第一条,如果是系统词库,野风怎么直接编辑呢?

兄弟啊!若是别人问这个问题,我不奇怪!你问这个问题,我真的要晕过去了……你在坛子上这么长时间了,还不会编辑系统词库吗?
8
发表于 2008-12-5 10:18:28 | 只看该作者
我采用快速调频,请水秀解释一下词频记录在那个文件。如果是慢速呢?
9
发表于 2008-12-5 10:25:20 | 只看该作者
这和时间没有关系,我从来没有编辑过系统词库。
其它允许编辑的词库,我也没有直接编辑的经验。都是导出成文本的,编辑后,将原词库删除,重新建立。
主要是怕词库损坏。
你是说直接用UE打开编辑吗,告诉一下我怎么编辑。^_^
10
发表于 2008-12-5 10:39:22 | 只看该作者
原帖由 krsun 于 2008-12-5 10:25 发表
这和时间没有关系,我从来没有编辑过系统词库。
其它允许编辑的词库,我也没有直接编辑的经验。都是导出成文本的,编辑后,将原词库删除,重新建立。
主要是怕词库损坏。
你是说直接用UE打开编辑吗,告诉一下我怎 ...


这当然和在论坛的时间有关系!在今年年初,有过好几个帖子谈如何编辑系统词库。你是老坛友了,应该看到过……新来的就不好说了……你……咳…咳!

你-滴-明白?
11
发表于 2008-12-5 10:41:38 | 只看该作者
不要咳了
快点儿告诉我吧
12
发表于 2008-12-5 16:47:15 | 只看该作者
原帖由 krsun 于 2008-12-5 10:18 发表
我采用快速调频,请水秀解释一下词频记录在那个文件。如果是慢速呢?



呵呵,krsun,快速和慢速是不会分开记录词频的,打个比方,快速的话每输入一次,调频一次,慢速的话,每输入三次再调频一次还不行吗。
13
发表于 2008-12-5 21:31:24 | 只看该作者
%AppData%\unispim6\wordlib\ci_cache.dat
这个文件里面记录了用户输入过的词组,无论是用户造的词,还是用户造错已经删除的词。


清空上面这个文件(不删除),重启后,ci_cache.dat 恢复到清空前的大小。
很关心上面这个文件,正像楼主所说的,里面记录了用户所有打过的词,包括已经删除的词。非常担心随着时间的推移,文件大小会无限制地膨大……

14
发表于 2008-12-5 22:01:08 | 只看该作者
原帖由 龙城水秀 于 2008-12-5 16:47 发表



呵呵,krsun,快速和慢速是不会分开记录词频的,打个比方,快速的话每输入一次,调频一次,慢速的话,每输入三次再调频一次还不行吗。

还是没有说词频记录在那个文件里
15
发表于 2008-12-6 13:48:48 | 只看该作者
发现一个秘密,我把ci_cache.dat 删除了,重启后,虽然能正常使用,但词频竟然恢复到了新安装的初始状态,看来这个ci_cache.dat 不光是记录了用户所有用过的词,还记录了用户的词频!krsun 看样子对你有参考作用 歪打正着!!
16
 楼主| 发表于 2008-12-19 05:41:19 | 只看该作者
我提的问题比较无谓啊,谢谢超版和管理员的热心回复。

对于第一个问题,我知道紫光默认是对系统词库只读操作的,这样也比较稳定。
我只是希望增加一个功能,在屏蔽系统词库功能的同时,提供一个清理屏蔽历史的功能。
搜狗以前也可以删除(屏蔽)系统词库,现在的新版就去除这个功能。

我比较关心的就是保留系统词库和冗余数据的问题。
ci_cache.dat 应该是用来保存词频的,删除之后不立即重启电脑,还会重新生成,我想是因为加载到内存去了。

ci_cache.dat  和 user.uwl 积累如此多冗余数据,应该都是因为输入法为了减少对词库、配置文件的读取作出的权衡策略吧。因为先前我导出词库再导入,就没有词频了(导出之后清理掉 %AppData%\unispim6\ 的配置文件)。所以我一般备份的时候,都是整个备份 %AppData%\unispim6\ 目录。

对这个问题我想提个建议,就是输入法增加记录用户造词的时间设置,例如5秒之内,(原有的2秒之内按退格键删除用户造词,我不知道是先记录再删除,还是2秒之后再记录了。当然这些都不是改写硬盘数据的,我也不清楚了。)
或者就是另外提供一个彻底清理词库冗余数据的功能。

我也日夜期待紫光的新版啊!
“清理词库冗余数据的功能”和“管理被屏蔽系统词条的功能”

[ 本帖最后由 imyours 于 2008-12-19 05:45 编辑 ]
17
发表于 2008-12-19 06:34:25 | 只看该作者
user这个文件就是用户词库,所有用户自造新词全部在这个文件内,你可以在词库管理内先导出文本文件,整理后,清空用户词库再导入就可以了。不用担心大量冗余,除非你经常造大量的新词且又不是废词。
ci_cache.dat 确实是记录用户词频的文件。主要是开发组怕频繁地读写系统词库造成不稳定所采取的折衷的办法。这个文件倒是有可能随着时间的推移,文件越来越庞大……
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 02:02

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表