LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
12
返回列表 发新帖
楼主: blxiao

谈谈Unicode编码

[复制链接]
发表于 2005-5-10 14:43:45 | 显示全部楼层
楼主不厚道,转贴不注明!

http://dev.csdn.net/article/69/69883.shtm
回复 支持 反对

使用道具 举报

发表于 2005-5-10 17:12:28 | 显示全部楼层
Post by mopz0506
用 UNICODE 就好了,根本没必要搞这个 GB18030,编码和全世界都不兼容。

如果都用 UTF-8,所以字符都统一了,根本没这么麻烦的编码问题。政府就是不干正经事,每次说到这里我就想骂那些搞出 GB 系列的人,xxxxxxxx。GB2312 除外,那时候统一编码的概念还不普及。



呵呵,被windrose编辑过了?
删除谩骂:),我不是常来,可惜没看见原来的帖子是什么:(

GB据说最开始是军方的标准,后来推广为民用,
之所以用GB18030是为了和以前的资料兼容,
如果改用UTF-8的话,很多文件都要重新编码,而且现在windows下面都是GB2312的编码
如果用UTF-8的话,资料共享会有一些问题,而且据说用UTF编码的文件会大一些,
另外各地的标准都不一样,也不必苛求GB系列,比如台湾的big5,日本的×××,
韩国的×××,什么我忘记了
多字节的文字基本上都是自己的编码,而不是UTF
回复 支持 反对

使用道具 举报

发表于 2005-5-10 17:27:58 | 显示全部楼层
http://www.linuxsir.cn/bbs/showthread.php?t=180572
还有我们老师的图文并茂的 ppt
回复 支持 反对

使用道具 举报

发表于 2005-5-10 17:33:53 | 显示全部楼层
http://tech.sina.com.cn/s/2001-07-26/1850.html

  GB 18030收录了27484个汉字,总编码空间超过150万个码位,为解决人名、地名用字问题提供了方案,为汉字研究、古籍整理等领域提供了统一的信息平台基础。

  目前,我国大部分计算机系统仍然采用GB 2312编码。GB 18030与GB 2312一脉相承,较好地解决了旧系统向新系统的转换问题,并且改造成本较小。从我国信息技术和信息产业发展的角度出发,考虑到解决我国用户的需要及解决现有系统的兼容性和对多种操作系统的支持,采用GB 18030是我国目前较好的选择,而GB 13000.1更适用于未来国际间的信息交换。考虑到GB 18030和GB 13000的兼容问题,标准起草组编制了GB 18030与GB 13000.1的代码映射表,使得两个编码体系可以自由转换。同时,还开发了GB 18030基本点阵字型库。

从沿革看新标准

  1980年我国颁布了第一个汉字编码字符集标准,即GB 2312-80《信息交换用汉字编码字符集基本集》。该标准共收了6763个汉字及常用符号,奠定了中文信息处理的基础。

  随着国际间的交流与合作的扩大,信息处理应用对字符集提出了多文种、大字量、多用途的要求。1993年国际标准化组织发布了ISO/IEC 10646-1《信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面》。我国等同采用此标准制定了GB 13000.1-1993。该标准采用了全新的多文种编码体系,收录了中、日、韩20902个汉字,是编码体系未来发展方向。由于其新的编码体系与现有多数操作系统和外部设备不兼容,所以它的实现仍需要有一个过程,目前还不能完全解决我国当前应用的迫切需要。

  考虑到GB 13000的完全实现有待时日,以及GB 2312编码体系的延续性和现有资源和系统的有效利用与过渡,我们选择了在GB 2312(GB 2311)的基础上进行扩充,并且在字汇上与GB 13000.1兼容的方案,研制一个新的标准——汉字编码基本集的扩充,进而完善GB 2312,以满足我国邮政、户政、金融、地理信息系统等应用的迫切需要。
回复 支持 反对

使用道具 举报

发表于 2005-5-10 19:06:38 | 显示全部楼层
“在GB 2312(GB 2311)的基础上进行扩充,并且在字汇上与GB 13000.1兼容的方案”
字汇兼容是说支持 Unicode 字符集,不会缺字。本来是要把国际标准作为国家标准的,后来就被自主知识产权给耽误了
fat 文件系统为什么要依赖于某个特定的字符集呢
回复 支持 反对

使用道具 举报

发表于 2005-5-11 09:27:10 | 显示全部楼层
昨天重装deiban sage rc3
为了照顾WinXP,便改成GBK了~~~
FAT32分区用gb2312挂载~~~
回复 支持 反对

使用道具 举报

发表于 2006-7-11 09:00:28 | 显示全部楼层

不错

分析的真的很不错
回复 支持 反对

使用道具 举报

发表于 2006-7-15 20:06:32 | 显示全部楼层
.....


标准是非常重要滴。。。。

现在我的debian 控制台,KDE等全用UTF-8,
保存文件只用kwrite 保存为GBK编码文件,节省存储空间,与WIN什么的兼容。

FAT32分区读写,SAMBA共享之类的程序,处理好配置文件,一般不会有什么问题了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表