LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: linxh

怎样判断一个文本文件的编码方式?

[复制链接]
发表于 2006-3-20 12:56:58 | 显示全部楼层
Post by 终极幻想
vi 也可以吧。。:)。。

我实验了一下,好像不行。
回复 支持 反对

使用道具 举报

发表于 2006-3-20 15:18:38 | 显示全部楼层
在坛子Ì搜索 .vimrc 文ö
回复 支持 反对

使用道具 举报

发表于 2006-3-22 07:41:54 | 显示全部楼层
有个叫 moreutils 的东东内含 isutf8 命令可以检查文件是否用 utf-8
回复 支持 反对

使用道具 举报

发表于 2006-5-11 12:39:07 | 显示全部楼层
vim
:set fileencoding
好象可以判断GBK和utf8之类的编码
不过其它的编码好象有些问题
比如我下的一个字幕
iconv -f cp949 -t utf8 ... 就显示正常
不过在vim里它判断为gb18030
不知道为什么

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2006-5-11 12:50:46 | 显示全部楼层
我的.vimrc :
set fileencodings=ucs-bom,utf8,GB18030,Big5,latin1
是不是跟这个有关系
回复 支持 反对

使用道具 举报

发表于 2006-5-11 13:16:32 | 显示全部楼层
判断是哪种legacy encoding似乎不太可能。
回复 支持 反对

使用道具 举报

发表于 2009-7-21 11:31:33 | 显示全部楼层
用beyond compare
打开文件的时候会自动检测文件编码
有linux版
回复 支持 反对

使用道具 举报

发表于 2009-7-21 20:51:29 | 显示全部楼层
Post by linuxcpp;1412400
如果是zh类的locale
gedit能自动识别
但是如果是en_US.utf-8的locale
gedit就识别不出来了
所有的GB*类的编码文件都是ISO-8859 text
而且是乱码


用gconf-editor可以添加gedit中文locale支持
回复 支持 反对

使用道具 举报

发表于 2009-7-21 21:13:33 | 显示全部楼层
我一直使用SciTE,有时也用xemacs来处理不同编码的文件。
回复 支持 反对

使用道具 举报

发表于 2009-7-22 09:37:11 | 显示全部楼层
这个以前见过,用
  1. file -i filename
复制代码
就可以了
gb2312显示的是iso-8859-1
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表