华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 10280|回复: 7
打印 上一主题 下一主题

对紫光输入策略的一个建议

[复制链接]
跳转到指定楼层
1
发表于 2008-10-26 03:31:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
--------------------------------------
摘要
1.建议使用 声调、末笔 相结合的方法筛选同音字。
这对于暂时没有满意词库的专业词汇(如中医药词汇)输入有很大帮助。
2.增补一些中医药学特有的字和读音。
  如 左“白”右“光”           读音同“恍”
     外上“庶”內下“虫”       读音同“哲”
     外上“疒”中“立”下“口” 读音似为“倍”   
3.中医药词汇具有特殊性,如果可能的话,研究一下中医药词库制作的方法学问题。
--------------------------------------



我是紫光的老用户了,几乎用过了所有的拼音输入法,最终还是选择了紫光。
其实,对于常用字词的输入,一线的拼音输入法(比如qq,google,sogo,紫光)都是差不多的,
当然,易用性多多少少有所差异,从长期来看,这些差异并不能导致用户群体的大量变化。
换言之,对于一般用户来说,用什么输入法都无所谓,只要适应了就好。
但是,对于某些专业用户来说就不是这么回事了。
比如,我是学中医的。中医名词的输入是一个非常头痛的事情。
举几个例子,“相生、相长、相乘、相克、相侮、相需、相使、相畏、相杀……”,
上面引号里面的都是中医学的最基本词汇,
在输入这类最基本词汇的时候,任何输入法都不可能提供现成的词库。
更不必说由这些基本词汇衍生出来的非专业的专业词库,比如“相需为用、乘克制化……”
有感于此,我在07年12月制作了中医词库,见http://www.unispim.com/wordlib/wordlib_detail.php?id=42
该词库不到1年已经下载了3800余次,可见对中医类词库的需求多么强,
但是,在制作和应用词库的过程中,我认识到一个问题,
中医词库与其他自然科学词库,比如西医词库,有本质区别,
举例来说,西医讲“平滑肌”,无论在任何情况下都是固定的这三个字的组合,不会有改变,
而中医词汇是中国传统文化的表现形式,是非常自由的,同一个词汇会变化出很多的表现形式。
比如:“阴阳、阴分、阴中之阴、阴中之至阴;肾阴、肺阴、心阴、心肾之阴、心肾阴虚、肺肾之阴、肺肾阴虚……”
上面一行中的五个两个字组成的词还能算是中医学术语,但是多字的词就很难说是严格的中医术语了,
但是又确实是中医工作者每天都在用的词汇,要给这样富于变化的词汇做词库谈何容易!
这还只是举了中医学最基础的中医基础理论里面的词汇为例,
若是加上中医诊断、方剂、中药、中内、外、妇、儿、等等学科中的词汇,
及各科词汇的相互组合,大概到我死掉也看不到一个用着顺手的中医词库了。
并且现在制作中医词库有一个重大障碍,
就是中国传统文化氛围没了,人们日常说的话已经不是过去的话了。
其实中医里面的术语,即便在民国时代也只是大家每日在说的口语,就像我们现在qq聊天一样的。
但是现在没有了这种文化环境、语言环境,
这就意味着,通过对大型的语料库的分析制作出满意的中医词库已经基本不可能了。
有鉴于此,我建议
1.采用多种方法相结复合选字。
  比如改成拼音+末笔划+音调结合的方法。
  (我知道现在已经可以拼音+音调,但是对于只有4个常用音调的汉字来说,音调筛选同音字效率不高。)
  (我也知道可以用笔划模式,但是那样输入效率还不如用拼音。)
  这样对于没有找不到的词,可以选择的更容易些,
  比如输入马刀挟瘿、萆薢渗湿汤这样的词汇时,可以少翻几页。
2.增补一些中医药学特有的字和读音。
  如 左“白”右“光”           读音同“恍”
     外上“庶”內下“虫”       读音同“哲”
     外上“疒”中“立”下“口” 读音似为“倍”
   不能输入的字还有很多,不是火星文,都是中医学常用字。
   这个是我临时想到的,似乎不是输入法的问题而是系统字库的问题。能解决就解决一下吧。
3.中医药词汇具有特殊性,如果可能的话,研究一下中医药词库制作的方法学问题。

有问题可联系huanggua_1@126.com

[ 本帖最后由 huanggua_1 于 2008-10-26 03:34 编辑 ]
2
发表于 2008-10-26 10:05:26 | 只看该作者
就中医词库问题,曾经询问过一个学中医的同学,他说平时很少用电脑输入中医词汇,大部分人习惯用智能ABC。看楼主所说,中医词汇当中应该有很多Unicode下的字符,紫光目前是不支持的。所以,还是需要等紫光的改进。
3
发表于 2008-10-26 10:34:53 | 只看该作者
中医词库的制作是大难题。看了楼主的长文,乱说几点:
1.多人合作,收集词条。建议约请他人,参考中医药大型辞典、权威教材,收集足够量的中医药学词条。到中医药大学论坛邀请有志学生或许有望。
2.仔细正形,消除别字。多人合作,难免输入中出现错别字。中医药词条的正形工作,非一般文字工作者可以完成,只有对医古文有一定造诣的人方可完成。
3.借助工具,删繁就简。完成上述两项后,或自己动手,或请开发组帮忙,删除官方系统词库中已有的词条(注意拼音!),形成独立的中医药词库。
4.与时俱进,校定读音。中医药词汇中有许多字的读音与现汉普通话读音不同,紫光现行字库中可能没有收录一些特殊古音,专为中医药词库对现行字库读音进行大规模修订恐难实现。我认为可以按照现汉读音。中医学词汇肯定有一些字不在GBK字符集之内,但估计数量不大,涉及的相关词条不收影响不大。
5.特定对象,特定词频。由于中医药学的式微,借助语料库确定词频,恐怕输入时查找复杂,应手工调整词频。
4
 楼主| 发表于 2008-10-26 13:01:38 | 只看该作者
原帖由 kingdick 于 2008-10-26 10:05 发表
就中医词库问题,曾经询问过一个学中医的同学,他说平时很少用电脑输入中医词汇,大部分人习惯用智能ABC。看楼主所说,中医词汇当中应该有很多Unicode下的字符,紫光目前是不支持的。所以,还是需要等紫光的改进。


他是本科生?
我在读研究生,
我平时写文章、编写教材、写论文 那叫一个累啊。
5
发表于 2008-10-26 14:37:05 | 只看该作者
呵呵!对,本科。中医要七年才有资格做医生啊!哈哈!
6
发表于 2008-10-26 22:57:42 | 只看该作者
是对紫光有益的建议,但是可以想象,现在的紫光开发组可能没有能力独立完成该项工作,(^_^我在此没有贬低开发组的意思),非中医专业的人士,只怕也不敢轻易接招。
sanwsw版主的意见倒是可取,建议楼主当仁不让,就勇挑重担吧。
将来紫光肯定是会支持Unicode的,那时候相信你的词库将会比现在更好
7
 楼主| 发表于 2008-10-27 09:17:15 | 只看该作者
原帖由 ljdqe 于 2008-10-26 22:57 发表
……非中医专业的人士,只怕也不敢轻易接招。建议楼主当仁不让, ...


看来得等我当上导师再说了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-26 03:26

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表