- 主题:看了看GB18030,是人是鬼还是神?
因为站在中国人的立场,gb18030是一个比unicode更好的全球文字编码方案。
【 在 cwall 的大作中提到: 】
: 这个当然
: 我只是不明白,18030到底比GBK多了什么东西,值得这么做。
: 按软件版本来衡量,这只是个小升级而已,多了100多个汉字的编码。
: ...................
--
FROM 171.221.52.*
可以用UTF16呀
咋不说Ascii对汉字更歧视,人压根儿就没汉字
【 在 poocp () 的大作中提到: 】
: utf-8的编码设计充满对汉字的歧视,gb18030就证明了2字节表达大多数汉字的变长编码根本不是技术问题。
:
: 【 在 fanci 的大作中提到: 】
--
FROM 203.145.95.*
UTF16和gb18030这种变长编码相比,缺陷明显。
utf-8的三字节常用汉字和gb18030的二字节常用汉字相比,缺陷明显。
总结就是站在中国人的立场看,unicode很垃圾,从技术上讲全世界都用gb18030也没啥问题,代价转移而已。
【 在 fanci 的大作中提到: 】
: 可以用UTF16呀
: 咋不说Ascii对汉字更歧视,人压根儿就没汉字
--
FROM 171.221.52.*
【 在 poocp 的大作中提到: 】
: 因为站在中国人的立场,gb18030是一个比unicode更好的全球文字编码方案。
:
这么说的话,美国人应该想当然的认为英语就足够了,搞什么utf-8,直接推广英语就好了。
什么问题都站在自己的立场上看,这显然是狭隘的。
utf-8已经支持汉语符号,甚至连象棋的棋子都做了编码定义,作为中国,应该好好画一画自己的汉字吧。
基础工作不去做,就要上灶台当灶王爷,也得有人供才行啊。
--
FROM 221.218.206.*
技术板块发这些技术无关的抱怨有意思么,而且方正兰亭,汉仪华旗都有gb18030的字库字模。输入法能不能打出某个字是输入法软件的问题,关编码什么事。
【 在 cwall 的大作中提到: 】
: 这么说的话,美国人应该想当然的认为英语就足够了,搞什么utf-8,直接推广英语就好了。
: 什么问题都站在自己的立场上看,这显然是狭隘的。
: utf-8已经支持汉语符号,甚至连象棋的棋子都做了编码定义,作为中国,应该好好画一画自己的汉字吧。
: ...................
--
FROM 171.221.52.*
展望未来,gb18030预留的编码空间也是完全有必要的。
从考古角度看,甲骨文的解读起码还有一小半文字至今无法解读,但不排除将来会在这方面出现突破,而且未来考古发现新的甲骨文字也需要对其编码。
从汉字演化看,如果甲骨文算中文v1.0,小篆算中文v2.0,繁体中文v3.0,简体中文v4.0,未来还可能出现新的演化例如星际中文v5.0,宇宙通用语v6.0,制定编码标准当然要有足够的远见,以免陷入ipv4那种ip地址不足的窘境。
--
FROM 171.221.52.*
【 在 poocp 的大作中提到: 】
: 展望未来,gb18030预留的编码空间也是完全有必要的。
: 从考古角度看,甲骨文的解读起码还有一小半文字至今无法解读,但不排除将来会在这方面出现突破,而且未来考古发现新的甲骨文字也需要对其编码。
: 从汉字演化看,如果甲骨文算中文v1.0,小篆算中文v2.0,繁体中文v3.0,简体中文v4.0,未来还可能出现新的演化例如星际中文v5.0,宇宙通用语v6.0,制定编码标准当然要有足够的远见,以免陷入ipv4那种ip地址不足的窘境。
编码的意义在于,这些信息需要计算机进行处理。
注意,是处理,不是存储。
如果仅仅是为了存储,显然这种工作毫无意义。
况且,编码是第一步,实现输入和输出才算是编码的结果,另外还要看实际应用情况。
编码的意义,无非就是解决实际问题而已,不是为了编码而编码,好大喜功,天天往里编符号,输入是软件的问题,显示是硬件的问题,和自己无关。
这不是扯淡么
--
FROM 221.218.206.*
千年虫问题就是时间编码的问题,没余量是要付出代价的
【 在 cwall (宝塔) 的大作中提到: 】
: 编码的意义在于,这些信息需要计算机进行处理。
: 注意,是处理,不是存储。
: 如果仅仅是为了存储,显然这种工作毫无意义。
: ...................
--
FROM 219.136.129.*
gb2312、gb18030、unicode 是字符集(character set),核心概念是 code point 和 bmp,而 utf-16 le/be、utf-8 是 encoding。这都什么驴唇不对马嘴的东西扯到一起去了?
微软搞了一套 gbk,兼容 gb2313 同时支持当年的 unicode,gb18030 就是拿了过来然后说我们支持 unicode 字符集,明摆着就是 unicode 的方言而已。
emoji 放到 utf-8 里要4个字节,mysql 之类山寨数据库还得专门搞个 utf8mb4 才能支持,不然就死给你看。那你要不要说西方国家歧视自己啊?
【 在 cwall (宝塔) 的大作中提到: 】
: 借用了utf-8的变长字节编码方式,然而不是utf-8
: 编码空间高达一百多万,然而事实上可能只有两、三万。
: 为了兼容GBK,各种绕
: ...................
--
FROM 122.57.156.*
p啦,真爱惜存储空间,加一层压缩,字典啦,霍夫曼树啦,都有啦
【 在 poocp (慢速随机指标) 的大作中提到: 】
: UTF16和gb18030这种变长编码相比,缺陷明显。
: utf-8的三字节常用汉字和gb18030的二字节常用汉字相比,缺陷明显。
: 总结就是站在中国人的立场看,unicode很垃圾,从技术上讲全世界都用gb18030也没啥问题,代价转移而已。
: ...................
--
FROM 111.163.122.*