水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
返回
1/1
|
转到
主题:utf-8 是不是只需要4个字节就可以装下所有的unicode
楼主
|
zli07
|
2022-06-23 13:22:23
|
展开
根据utf-8的编码规则,4个字节可以容纳21比特数据,最多可以到U+1FFFFF,而unicode的平面数目前最多是17个(U+00xxxx ~ U+10xxxx)。
这也是 mysql用utf8mb4的意义,除非存储那些自定义的unicode字符,不然4字节够了
--
修改:zli07 FROM 49.7.47.*
FROM 49.7.47.*
3楼
|
zli07
|
2022-06-24 16:05:32
|
展开
嗯。。倒也是,UTF-16真是脑瘫设计出来的,本来UCS2为了性能舍弃扩展性还说得过去,结果UTF-16折腾了半天
最多能存22位数字,扩展性上甚至不如UTF-8,再加上编解码的时候除了位运算还要做一次加减法。。
【 在 cybereagle 的大作中提到: 】
: unicode 为了UTF-16已经把码点范围统一限制到 ~U+10FFFF 以内了
: 所以没错utf-8用4个字节就足够覆盖了
--
FROM 49.7.47.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版