|
|
发表于 2005-11-11 20:09:40
|
显示全部楼层
输入法内部通常采用UNICODE(比如UTF-16)编码的,传出的时候再转化为本地字符集比如linux常用的zh_CN.UTF-8或是Windoze的GBK。通常应用程序都会使用本地(locale命令的LC_ALL对应的编码)编码。但不推荐使用弱字符集如GBK/GB2312,因为他们同UNICODE字符集是无法一一映射的。导致本地编码无法描述全部的UNICODE字符。
UTF-8也是UNICODE的一种,是强字符集,比较新的linux都默认采用这个字符集了,而且兼容性非常好。如果应用程序由于某些原因无法直接使用如UTF-16/UTF-32编码,则可以考虑采用UTF-8。 |
|