LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
楼主: go1640

有关 utf8 字符集的讨论请进这里!

[复制链接]
发表于 2005-1-15 11:41:52 | 显示全部楼层
Linux完全用locale来设置系统是不是不太科学,所有的东西都没办法改了,或者改起来很麻烦。

不知道有没有更好的方法。
回复 支持 反对

使用道具 举报

发表于 2005-1-15 11:46:12 | 显示全部楼层
什么东西没法改了?我倒觉得对多语种支持得非常好
回复 支持 反对

使用道具 举报

发表于 2005-3-5 13:14:29 | 显示全部楼层
你能用acrobat reader 7打开中文文件名的文件吗?

我就是为了它而改成utf8的
utf8才是王者
回复 支持 反对

使用道具 举报

发表于 2005-3-5 13:26:57 | 显示全部楼层
我可以用acrobat 5打开中文pdf。因为目前大部分的中文编码都是gbk或者它的子集gb2312的,而真正采用utf-8编码的中文比较少,例如你使用utf-8编码以后,存储的中文文件名,在window下面就是乱码,还有以前在windows下面写的文档和程序中的中文也是gbk编码,拿到utf-8下面就会乱码,这样还需要使用iconv工具转换一下,而且转了以后在回到windows就又都乱码拉。因此我建议还是是用gbk比价好,而且fc 3在gbk下面工作的挺好。
回复 支持 反对

使用道具 举报

发表于 2005-3-5 13:28:22 | 显示全部楼层
我个人认为还是用zh_CN的locale好
显示中文绝对的好
回复 支持 反对

使用道具 举报

发表于 2005-3-6 02:03:35 | 显示全部楼层
Post by wangxudong
我个人认为还是用zh_CN的locale好
显示中文绝对的好

zh_CN 是一个别名,不同的系统上定义可能是不同的
在 fc3/rhel4 中是 zh_CN.UTF-8 的别名
回复 支持 反对

使用道具 举报

发表于 2005-3-6 10:35:44 | 显示全部楼层
Post by challenger
可是为什么我在as4中改成zh_CN后,vfat分区用cp936就正常了?


zh_CN=zh_CN.GB2312

env LC_CTYPE=zh_CN xmms和env LC_CTYPE=zh_CN.GB2312 xmms

都能正确显汉字。

可在桌面建一启动器,用env LC_CTYPE=zh_CN xmms启动xmms.
回复 支持 反对

使用道具 举报

发表于 2005-3-6 12:53:54 | 显示全部楼层
Post by hua_jacky1977
我可以用acrobat 5打开中文pdf。因为目前大部分的中文编码都是gbk或者它的子集gb2312的,而真正采用utf-8编码的中文比较少,例如你使用utf-8编码以后,存储的中文文件名,在window下面就是乱码,还有以前在windows下面写的文档和程序中的中文也是gbk编码,拿到utf-8下面就会乱码,这样还需要使用iconv工具转换一下,而且转了以后在回到windows就又都乱码拉。因此我建议还是是用gbk比价好,而且fc 3在gbk下面工作的挺好。

但是acrobat reader 5的open窗口不能正确显示中文的文件名(文件名不是文件本身)
acrobat reader 7可以显示,但是在gbk的lang下是打不开的,只有是utf8下才可以打开
中文内容的显示,两个版本都没有问题
文件名是不会乱码的,mount windows的分区的时候加utf8参数,此外也可以用convmv来转换
使用支持多编码的软件就可以了,比如win的记事本,linux下的gedit,不需要转换编码
现在linux之所以用utf8作为默认的locale,必然是有它的道理的
只有我们大家都支持这样才能进一步推动它的推广
试想如果所以的操作系统都用统一的utf8(utf16)编码,带给我们的就不仅仅是一点点的方便了
回复 支持 反对

使用道具 举报

发表于 2005-3-6 13:02:41 | 显示全部楼层
Post by qchem
但是acrobat reader 5的open窗口不能正确显示中文的文件名(文件名不是文件本身)
acrobat reader 7可以显示,但是在gbk的lang下是打不开的,只有是utf8下才可以打开
中文内容的显示,两个版本都没有问题
文件名是不会乱码的,mount windows的分区的时候加utf8参数,此外也可以用convmv来转换
使用支持多编码的软件就可以了,比如win的记事本,linux下的gedit,不需要转换编码
现在linux之所以用utf8作为默认的locale,必然是有它的道理的
只有我们大家都支持这样才能进一步推动它的推广
试想如果所以的操作系统都用统一的utf8(utf16)编码,带给我们的就不仅仅是一点点的方便了

但是例如我们在公司里面开发一个项目,其中有人使用linux有人用windows,如果使用linux的人编码或者写文档的时候都是用utf-8,而windows下面的兄弟都使用gbk,那你说会有什么问题发生?所以我想以前那么多的使用gbk,gb2312的文档我们还是要保护的,转向utf-8不是我们一两个人说转就能够转的,如果有人说约定一个时间点一起转,那么还有希望,但是你觉着这个事情谁能来做呢?毕竟,gb2312和gbk是国家的标准呀.不知楼上的兄弟怎么想?
回复 支持 反对

使用道具 举报

发表于 2005-3-6 23:31:34 | 显示全部楼层
Post by hua_jacky1977
但是例如我们在公司里面开发一个项目,其中有人使用linux有人用windows,如果使用linux的人编码或者写文档的时候都是用utf-8,而windows下面的兄弟都使用gbk,那你说会有什么问题发生?所以我想以前那么多的使用gbk,gb2312的文档我们还是要保护的,转向utf-8不是我们一两个人说转就能够转的,如果有人说约定一个时间点一起转,那么还有希望,但是你觉着这个事情谁能来做呢?毕竟,gb2312和gbk是国家的标准呀.不知楼上的兄弟怎么想?

我们就是这样啊,我们用 eclipse 和 cvs 来工作,平台不一样,但是 eclipse 可以为每个项目设置默认字符编码。UTF-8 还是很爽的。你用过 rh9 的 KDE 没有?当时不是 UTF-8,假如你用不同的语言登录一次系统,那么桌面上会重新生成一个 “主目录” 图标,而原来的图标文字是乱码。这个图标是不可能删掉的,除非将整个桌面目录都删掉。发生过几次这样的事情之后,我对 KDE 和 GB* 编码的好感就一点也没有了。再想想假如你要给国外的朋友写信,中文信件,但是他们可能只有 UTF-8 中文,没有 GB* 中文
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表