华宇拼音输入法论坛

标题: 推荐“大分词”小软件 [打印本页]

作者: sanwsw    时间: 2008-2-1 13:20
标题: 推荐“大分词”小软件
  刚才加加论坛上发现张文焕开发的“大分词”小软件,绿色软件,无须安装。本人添加一篇例文,该例文中内容为刚才从人民网下载的党政公文十来篇的简单汇总;“fc.txt”为该例文分词后删除重复词的结果。所有文本文档切分后保存结果的文件名均为“fc.txt”。

  作用:给成篇文本进行按“词”切分,为专业词汇积累、词库制作提供基础语料

  试用提醒:
  ①如你想积累某一专业领域的惯用词汇,可下载尝试;

  ②须结合EmEditor等其它文本处理软件删除重复词条

  ③毕竟是小软件,其切分效果不可能绝对准确;

  ④现代汉语经典著作切分准确率会高一些。

大分词V1.01.rar

346.76 KB, 下载次数: 1025

作者:张文焕


作者: sanwsw    时间: 2008-2-1 16:08
  删除一字词方法:
  ①先用EmEditor软件及本人上传插件(76个汉化插件)删除重复行、空白行;

  ②将全部词语(或短语、短句)复制到Excel的A1列,在B1中输入函数: =LEN(A1)

  ③复制B1的公式到最后一行,即可在B列中显示A列词条的汉字数;

  ④利用数据-排序功能将“一字词”排在一起了。
作者: michsun    时间: 2008-2-1 17:09
刚刚试了一下软件小巧不错的!




欢迎光临 华宇拼音输入法论坛 (http://bbs.pinyin.thunisoft.com/) Powered by Discuz! X3.2