|
|
中医词库的制作是大难题。看了楼主的长文,乱说几点:
1.多人合作,收集词条。建议约请他人,参考中医药大型辞典、权威教材,收集足够量的中医药学词条。到中医药大学论坛邀请有志学生或许有望。
2.仔细正形,消除别字。多人合作,难免输入中出现错别字。中医药词条的正形工作,非一般文字工作者可以完成,只有对医古文有一定造诣的人方可完成。
3.借助工具,删繁就简。完成上述两项后,或自己动手,或请开发组帮忙,删除官方系统词库中已有的词条(注意拼音!),形成独立的中医药词库。
4.与时俱进,校定读音。中医药词汇中有许多字的读音与现汉普通话读音不同,紫光现行字库中可能没有收录一些特殊古音,专为中医药词库对现行字库读音进行大规模修订恐难实现。我认为可以按照现汉读音。中医学词汇肯定有一些字不在GBK字符集之内,但估计数量不大,涉及的相关词条不收影响不大。
5.特定对象,特定词频。由于中医药学的式微,借助语料库确定词频,恐怕输入时查找复杂,应手工调整词频。 |
|