LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 847|回复: 9

请问字符集如何工作??原理!!

[复制链接]
发表于 2005-2-1 01:37:01 | 显示全部楼层 |阅读模式
总在看如何设置xmms的字符,如何安装一个字体,可是为什么我一点都不懂。
请高手给我讲讲有关字符的东西吧!!!
什么是utf8啊,为什么他用7个byte显示两个汉字?
gb2312,iso,gbk还有个什么gb1****都是什么东西啊
而这些又和从windows复制过去的.tt*有什么关系啊?
gtk1.0,2.0和我的fc1的字符表示方法有什么不一样么?
为什么我的windows的中文文件名在用浏览的时候正常,而在mplayer和xmms下显示不正常呢?



还有我的locale是en_UTF-8如何配置才能完全正确的显示所有中文呢?
 楼主| 发表于 2005-2-1 01:40:01 | 显示全部楼层
自己先顶一下啊
回复 支持 反对

使用道具 举报

发表于 2005-2-1 01:45:29 | 显示全部楼层
这些东东不是一下子讲得清的吧?

如果很简单,就不用汉化美化这许多烦恼了。
回复 支持 反对

使用道具 举报

发表于 2005-3-14 01:05:01 | 显示全部楼层
顶,我也让这些东东弄得头上长白毛了,我现在用FVWM,里面很多地方都显示乱码,还有EMACS里也有些字显示方框的.但我都不想去看网上那些关于如何解决的速成方法.那些看了也是治标不治本.我现在只想找有关于LINUX方面的字体服务器,字符集方面的全面介绍原理的文章,如果哪位知道哪有这方面资料的,麻烦通个气,不胜感激.
回复 支持 反对

使用道具 举报

发表于 2005-3-14 01:45:56 | 显示全部楼层
如果你的离散数学比较好,我也许能给你说清楚。

编码(Encoding)和字符集(Charset)是两个东西。字符集是一个字符的集合,集合中的每一个元素就是字符。而编码是一对一的映射,它将字符集中的字符表示为二进制数。比如对于Unicode 4.0这个字符集来讲,就有多种编码可选,比如UTF-7,UTF-8和UTF-16。

GB2312、GBK、GB18030都是中国政府制订的字符集,并且在制定这些字符集的同时也制定了唯一的一种编码。对于这三种编码,无论是字符集还是编码,都存在以下包含关系:GB2312全包含于GBK,GBK全包含于GB18030。也就是说,“一”这个汉字在GB2312中对应的编码,与它在GB18030中对应的编码是相同的。由于这三种字符集都只有一种编码,所以一般也把它们的名字用作编码的名字。

从字符集角度来说,GB18030和Unicode 4.0是等价的,也就是说这两个字符集所容纳的字符是完全相同的。在Linux中,实现Unicode 4.0所用的编码基本都是UTF-8。而UTF-8和GB18030这两种编码是不同的,所以就出现了编码转换的需求,这一转换是通过iconv来完成的。

至于字体方面,实在是牵涉到太多历史问题。我即便把这些东西都写出来,也是一些枯燥的技术词汇堆积,因为它实在没有办法用通俗的语言描述清楚。

个人意见是,如果你不打算研究X本身,而只想使用X上的应用程序,没有必要知道那么多技术细节。最后对楼主说一句话,使用en_US什么用也没有,既不能把英语学好,也不能很好的使用现有的中文资源,请不要再自讨苦吃了,更何况你使用的是一个最不被众人看好的发行版。
回复 支持 反对

使用道具 举报

发表于 2005-3-18 02:58:17 | 显示全部楼层
再请教楼上的大哥一个问题,既然gb2312,gbk,gb18030的编码都是相同的。那LINUX里用这三种编码的字符集是不是都是一样的呢(就是说随便用哪种都可以的呢?),
还有能不能给们介绍点这些方面的资源给我们呢?如:介绍这方面的书,网站什么的。谢谢了。
回复 支持 反对

使用道具 举报

发表于 2005-3-18 03:20:10 | 显示全部楼层
楼上的完全没听明白……汗……fundawang白费力气了……
回复 支持 反对

使用道具 举报

发表于 2005-3-19 01:01:17 | 显示全部楼层
不好意思,昨天没看仔细,真是该死。哪位大侠能不能给介绍点关于编码和字符集方面的资源呢?谢谢了
回复 支持 反对

使用道具 举报

发表于 2005-3-19 02:16:12 | 显示全部楼层
买一本关于字符集的国家标准就行了。
回复 支持 反对

使用道具 举报

发表于 2005-3-19 09:53:29 | 显示全部楼层
感觉fundawang有些白费力气了,
不过我倒是收获不小:)
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表