LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1138|回复: 5

请教中文字词统计

[复制链接]
发表于 2005-11-22 23:36:32 | 显示全部楼层 |阅读模式
我平常用vim比较多,写稿时需要统计中英文字词,请问有没有工具或代码可以做得到?
c、python、ruby、perl的都可以,vim脚本当然更好啦~
发表于 2005-11-23 18:41:44 | 显示全部楼层

  1. awk '/word/{num++}END{print "total:",num}'
复制代码
回复 支持 反对

使用道具 举报

发表于 2005-11-23 21:00:54 | 显示全部楼层
楼上这个是统计某个字词出现的总次数吧。

wc试试
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-11-23 23:52:50 | 显示全部楼层
wc只能统计英文,我要统计的中文字数。
回复 支持 反对

使用道具 举报

发表于 2005-11-24 00:49:35 | 显示全部楼层

  1. /home/lee#echo "我爱linux,我爱shell,你呢?"|od -c|grep -o '\<[0-9]\{3\}\>'|wc -l|xargs -i echo {}/2|bc
  2. 6
复制代码
回复 支持 反对

使用道具 举报

 楼主| 发表于 2005-11-24 17:02:57 | 显示全部楼层
faint,这个好强。不过这只能统计gbk内码的,通用性稍差了一点。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表