不能,CJK扩展字符(Supplementary Ideographic Plane)在UTF16中必须使用surrogate pair也就是32-bit表示。
https://learn.microsoft.com/en-us/globalization/encoding/surrogate-pairs
https://zh.wikipedia.org/wiki/Unicode%E5%AD%97%E7%AC%A6%E5%B9%B3%E9%9D%A2%E6%98%A0%E5%B0%84
第二辅助平面又称为表意文本补充平面(Supplementary Ideographic Plane,缩写SIP,或简称Plane 2),整个范围在U+20000~U+2FFFF。整个平面配置的都是一些罕用的汉字或地区的方言用字,如粤语用字及越南语的字喃。现时摆放了“中日韩统一表意文本扩展B区”(4万3253个汉字)、“中日韩统一表意文本扩展C区”(4149个汉字)、“中日韩统一表意文本扩展D区”(222个汉字)、“中日韩统一表意文本扩展E区”(5762个汉字)、“中日韩统一表意文本扩展F区”(7473个汉字)以及中日韩兼容表意文本增补(CJK Compatibility Ideographs Supplement)。
【 在 finlab 的大作中提到: 】
: 嗯, 如果是windows平台,msvc, 看起来是内部统一使用wstring方便些
: 如果只是处理中文,或者东亚文字, 是不是肯定不会出现四字节字符?
:
--
FROM 114.241.225.*