水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
返回
1/1
|
转到
主题:看了看GB18030,是人是鬼还是神?
4楼
|
JulyClyde
|
2020-02-24 17:34:22
|
展开
12345
13000
18030
【 在 cwall (宝塔) 的大作中提到: 】
: 借用了utf-8的变长字节编码方式,然而不是utf-8
: 编码空间高达一百多万,然而事实上可能只有两、三万。
: 为了兼容GBK,各种绕
: ...................
--
FROM 58.250.178.*
30楼
|
JulyClyde
|
2020-02-25 14:48:38
|
展开
【 在 eGust (十年) 的大作中提到: 】
: gb2312、gb18030、unicode 是字符集(character set),核心概念是 code point 和
: bmp,而 utf-16 le/be、utf-8 是 encoding。这都什么驴唇不对马嘴的东西扯到一起去
: 了?
: 微软搞了一套 gbk,兼容 gb2313 同时支持当年的 unicode,gb18030 就是拿了过来然
: 后说我们支持 unicode 字符集,明摆着就是 unicode 的方言而已。
: emoji 放到 utf-8 里要4个字节,mysql 之类山寨数据库还得专门搞个 utf8mb4 才能
: 支持,不然就死给你看。那你要不要说西方国家歧视自己啊?
mysql的utf8不是正经utf8,那是mysql的问题,不是utf8的问题
--
FROM 202.104.118.*
31楼
|
JulyClyde
|
2020-02-25 14:48:57
|
展开
utf-8本身已经挺huffman的了
【 在 tgfbeta (右旋肉碱) 的大作中提到: 】
: p啦,真爱惜存储空间,加一层压缩,字典啦,霍夫曼树啦,都有啦
--
FROM 202.104.118.*
84楼
|
JulyClyde
|
2020-02-26 14:41:30
|
展开
真没有的
gb18030和utf-8都明确规定了字节序和字符在字节流中的分界方法啊
【 在 eGust (十年) 的大作中提到: 】
: 我擦,合着你的意思 gb18030 就没有 endianess 问题了?给你一个 0x86 0x87 你给我说说看是哪个字?
--
FROM 202.104.118.*
124楼
|
JulyClyde
|
2020-02-28 10:00:11
|
展开
哪个网站现在还是gb啊?
【 在 sixue1999 (宋似雪) 的大作中提到: 】
: 然而你现在用的网站仍然是gb~
--
FROM 202.104.118.*
125楼
|
JulyClyde
|
2020-02-28 10:00:27
|
展开
2312和电报码有关系???
【 在 poocp (慢速随机指标) 的大作中提到: 】
: 不少80后90后没用过DOS,所以才闹出gb系列是微软写草稿的笑话。
: gb2312的前身是电报码,诞生于1873年。
: 1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:
: GB2312-80《信息交换用汉字编码字符集》基本集。
: 1981年,微软发布 IBM PC DOS 1.0 不支持中文
: 1983年,电子工业部第六研究所(后中国计算机系统工程公司)开发出CCDOS 1.0支持
: GB2312,CCDOS是中国大陆最早的汉字操作系统之一。
--
FROM 202.104.118.*
133楼
|
JulyClyde
|
2020-03-01 21:52:52
|
展开
水木网页版是不是懒得转码,直接把bbs内部数据搞成网页的?
【 在 seablue (deepblue) 的大作中提到: 】
: 他说的是水木网页版,这个是因为历史遗留问题没有改。
: 其实手机版已经是utf8了。
http://m.newsmth.net
--
FROM 183.61.6.*
159楼
|
JulyClyde
|
2020-03-05 10:24:52
|
展开
之前不是说编码空间都不一样大么
【 在 Bernstein (Berns) 的大作中提到: 】
: 很正常,字符集是字符集,编码是编码
: unicode是字符集,gb18030和utf-8各自都是unicode的一种编码,同一字符集的同一字符在不同编码下不保证一致
--
FROM 58.250.178.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版