华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 12336|回复: 2
打印 上一主题 下一主题

推荐“大分词”小软件

[复制链接]
跳转到指定楼层
1
发表于 2008-2-1 13:20:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  刚才加加论坛上发现张文焕开发的“大分词”小软件,绿色软件,无须安装。本人添加一篇例文,该例文中内容为刚才从人民网下载的党政公文十来篇的简单汇总;“fc.txt”为该例文分词后删除重复词的结果。所有文本文档切分后保存结果的文件名均为“fc.txt”。

  作用:给成篇文本进行按“词”切分,为专业词汇积累、词库制作提供基础语料

  试用提醒:
  ①如你想积累某一专业领域的惯用词汇,可下载尝试;

  ②须结合EmEditor等其它文本处理软件删除重复词条

  ③毕竟是小软件,其切分效果不可能绝对准确;

  ④现代汉语经典著作切分准确率会高一些。

大分词V1.01.rar

346.76 KB, 下载次数: 1028

作者:张文焕

2
 楼主| 发表于 2008-2-1 16:08:39 | 只看该作者
  删除一字词方法:
  ①先用EmEditor软件及本人上传插件(76个汉化插件)删除重复行、空白行;

  ②将全部词语(或短语、短句)复制到Excel的A1列,在B1中输入函数: =LEN(A1)

  ③复制B1的公式到最后一行,即可在B列中显示A列词条的汉字数;

  ④利用数据-排序功能将“一字词”排在一起了。
3
发表于 2008-2-1 17:09:44 | 只看该作者
刚刚试了一下软件小巧不错的!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2025-12-25 07:18

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表