我估计他说的多字节就是最简单的那种char*字符串,GB2312/GBK编码。
这类程序移植到utf-16最大的问题是改成w_char*后,各种std::string, strcpy, strcat之类以0结尾的字符串算法都得改,极度蛋疼。所以改用utf-8会方便很多,至少大部分情况下还是char*的那坨约定,修改量会小很多,只需要考虑IO部分的转码和内存越界问题。
【 在 hgoldfish 的大作中提到: 】
: 多字节是啥意思?win32api 里面的 wchar?
: 当年巨硬以为 utf-16 就能容纳全世界所有字符,没想到 unicode 现在连表情符都放进来了。更夸张的是,表情符还是兼容各种肤色,不能搞歧视!
: 现在别想那么有的没的。在大多数情况下,使用 utf8. 而在内存里面,我看现在的趋势是使用 utf-16.
: ...................
--
FROM 36.112.193.*