原帖由 岳家军 于 2008-7-27 10:43 发表
大语言模型库就是“大语料库”,紫光的大侠们觉得他不够规范,所以改成这个名字。
其实我觉得很多东西大家公认了就是对的,就像我们常说的“心想事成”,难道人是用心在想吗?但是已经形成习惯了,就不会在意他规范 ...
条件:来自上百G语料中提取出来的所有2~15字词及其出现频度,抛弃了出现少于3次的。
原帖由 野风 于 2008-7-27 10:32 发表
1、所谓大语言模型库是相对于输入法标准配置的语言模型而言的,因为比标配的大,故曰大语言模型库。模型库是输入法的有机组成部分,是不可分割的。而大词库则是输入法挂接的分类词库,因体积较大,且具备综合词类,故 ...
| 欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) | Powered by Discuz! X3.2 |