|
发表于 2005-7-25 01:33:54
|
显示全部楼层
“让系统全面使用utf8”不合适
“这是理论数字,实际上一个完整的系统里面中文文件占的比例很小,即使是中文 Windows,大部分还是英文单字节的文件。”
从系统的角度讲,上面的话有道理,让人觉得1.5倍是无所谓的事情。不过还有另外一笔账,不算13亿中国人,仅仅算上网的一亿网民,他们每天看到的汉字是多少?!
“而且普通用户还喜欢将中文文件存为 word 这样的格式。”
“word格式”就与汉字编码无关?
“双字节又不是只有中文在用。”
也不仅仅中国在制定自己的国家标准。世界许多国家和地区从方便本国和民族应用的角度出发,制定了相应的编码标准和内码体系,如日本的JISX0208和JISX0212,韩国的KSC5601和KSC5657等,这是国际上采用的通行惯例。
“中国法律不是朝令夕改吗”
别的法律不敢说,但字符集标准的改动是非常慎重的。
GB2312-80的主要缺点是字符不够用,这是当时的计算机硬件水平决定的,犯了和千年虫一样的错误;1993年国际标准化组织发布了ISO/IEC10646-1《信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面》。我国等同采用此标准制定了GB13000.1-1993。此后的GBK是微软强加给中国人的。
1998年10月,由信息产业部电子四所、北京大学计算机技术研究所、北大方正集团、新天地公司、四通新世纪公司、中科院软件所、长城软件公司、中软总公司、金山软件公司和联想公司的技术人员组成标准起草组。在标准研制过程中,全国信息技术标准化技术委员会多次召集标准起草组和知名公司对标准草案进行充分地研究论证,并且特邀了微软公司、惠普公司、Sun公司和IBM公司等参加,广泛征求意见。标准起草组经过反复斟酌和验证,提出了标准制定原则——与GB 2312信息处理交换码所对应的事实上的内码标准兼容,在字汇上支持GB 13000.1的全部中、日、韩(CJK)统一汉字字符和全部CJK扩充A的字符,并且确定了编码体系和27484个汉字,形成兼容性、扩展性、前瞻性兼备的方案。信息产业部和原国家质量技术监督局于2000年3月17日联合发布了该标准,即GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》。该标准作为国家强制性标准自发布之日起实施,过渡期到2001年8月31日止。
“朝令夕改”从何谈起?
“只说明中国自己计算机水平差,制订国际标准没有参与的实力。”
事物是发展的,中国自己计算机水平差的时候搞出了世界一流的激光照排系统;如今,华为中兴成WiMAX领先者,所持核心专利远高于3G
(http://tech.tom.com/1121/1367/2005718-232979.html)。
“unicode 才是大趋势,比如 windows xp 内部已经使用。”
对于unicode的好坏,于明俭在《Linux国际化本地化和中文化(http://www.linuxforum.net/doc/i18n-new.html)》一文中说的很清楚。
好处:
由于Unicode 的一致性,它在大多数情况下都可能简化软件的国际化过程,它取消了处理多种代码页的必要。
坏处:
但是,Unicode作为一种编码也有它的缺陷,比如编码的位置与排序无关,所以使软件支持Unicode仅仅是国际化的第一步, 实际情况中还需要与语言相关的信息和规则. 所以Unicode一般作为程序的内部处理编码, 必须提供与其它编码的双向转换表.
“windows xp 内部已经使用”Unicode,这并不妨碍各国的用户使用本国的编码。
“Google 呢?”
Goole是utf-8的,确实不应该忘掉Google,但居然没想到它,原因就是百度的中文搜索做得比它好,最近一两年老用百度了。说实话,微软和goole哪个都是财大气粗的,他们浪费的起我们可浪费不起。
整理一下结论:
UTF-8作为程序的内部处理编码,简化了软件的国际化过程,赞成;UTF-8造成了汉字传输、存储的巨大浪费,用户文件的汉字使用中国国家标准的编码完全符合国际惯例。所以说“让系统全面使用utf8”是不合适的。 |
|