我错了。我不知道怎么从 unicode 得到 gb18030 的 encoding。
比如“我”,
unicode codepoint: U+6211 (01100001 10110111)
对应的 utf-8 encoding: 0x e6 88 91 (1110.0110 10.000110 10.110111)
对应的 utf-16 encoding: 0x 6211 (10110111 01100001, little endian)
如果我知道文件编码是 utf-8,我可以找到对应的 unicode codepoint.
gb18030中“我”的 encoding 是 0xced2, 对应的 gb13000(ucs2 ~= unicode)
的 codepoint 也是 unicode codepoint U+6211。
但我不清楚 0xced2 是怎么从 U+6211 得到的。
你知道吗?
【 在 Bernstein (Berns) 的大作中提到: 】
: 你理解错了,先去看看资料吧;
: 我至少了解
--
FROM 114.246.87.*