- 主题:看了看GB18030,是人是鬼还是神?
utf-8本来就是个站在西方立场的编码方式,中国要是全社会用utf-8,2字节全部扩展到3字节的社会成本还是非常大的,坚持强制国标是正确做法。
【 在 cwall 的大作中提到: 】
: 肯定不是在gbk的基础上继续扩充
: 它的噱头是utf-8,其实和utf-8没有一毛钱关系
: 所谓的扩充,号称比gdk多了100多个字
: ...................
--
FROM 171.221.52.*
【 在 poocp 的大作中提到: 】
: utf-8本来就是个站在西方立场的编码方式,中国要是全社会用utf-8,2字节全部扩展到3字节的社会成本还是非常大的,坚持强制国标是正确做法。
:
我不太清楚的是,现在GBK里面的两万多个汉字,是不是用拼音都可以输入进去?以及字体情况怎么样。
18030和gbk貌似没多大改变,除了多了个utf-8的噱头。
--
FROM 221.218.206.*
我没在任何gb18030官方文档上提到你所谓拿utf-8做噱头的内容,根本就是两种不同的变长编码。utf-8除了方便西方人,让东亚文字付出代价,没啥值得称道的。
如果将来美国统治地球,它想推哪种编码就能推哪种编码。中国要是当上老大,估计gb18030这套体系进iso替代unicode没啥问题,当然还得修改适配其他国家文字。
国家标准这个方面,不是程序员左右得了的。
【 在 cwall 的大作中提到: 】
: 我不太清楚的是,现在GBK里面的两万多个汉字,是不是用拼音都可以输入进去?以及字体情况怎么样。
: 18030和gbk貌似没多大改变,除了多了个utf-8的噱头。
--
FROM 171.221.52.*
GB18030支持所有Unicode字符
最新的可能还没加入,但将来应该会加入的
【 在 poocp (慢速随机指标) 的大作中提到: 】
: 我没在任何gb18030官方文档上提到你所谓拿utf-8做噱头的内容,根本就是两种不同的变长编码。utf-8除了方便西方人,让东亚文字付出代价,没啥值得称道的。
: 如果将来美国统治地球,它想推哪种编码就能推哪种编码。中国要是当上老大,估计gb18030这套体系进iso替代unicode没啥问题,当然还得修改适配其他国家文字。
: 国家标准这个方面,不是程序员左右得了的。
: ...................
--
FROM 37.5.250.*
1.很早以前存储很贵,纯汉字存储采用gbk 会比utf8少很多空间。比如几百亿中文网页存储。
2.很多老的工具、软件从gb2312开始的,然后一步步演化到现在的。
【 在 cwall 的大作中提到: 】
: 借用了utf-8的变长字节编码方式,然而不是utf-8
: 编码空间高达一百多万,然而事实上可能只有两、三万。
: 为了兼容GBK,各种绕
: ...................
--
FROM 61.51.144.*
言重了,一个抖音视频够把金庸的所有书都编进去了。
【 在 poocp () 的大作中提到: 】
: utf-8本来就是个站在西方立场的编码方式,中国要是全社会用utf-8,2字节全部扩展到3字节的社会成本还是非常大的,坚持强制国标是正确做法。
:
: 【 在 cwall 的大作中提到: 】
--
FROM 203.145.95.*
utf-8能做到的,gb18030同样也能做到,而且对gb2312全兼容不用任何额外变动,我当然支持gb18030成为国际标准,utf-8就是一个歧视性的编码,中文一个汉字至少3字节,制定国家标准的脑抽了才会同意。而且这里头还有文字主权问题,汉字是需要为未来留够造字空间的,字母文字一般没那个需求,所以这个主动权必须掌握在汉字使用者这边。
【 在 evilll 的大作中提到: 】
: 1.很早以前存储很贵,纯汉字存储采用gbk 会比utf8少很多空间。比如几百亿中文网页存储。
: 2.很多老的工具、软件从gb2312开始的,然后一步步演化到现在的。
--
FROM 171.221.52.*
【 在 evilll 的大作中提到: 】
: 1.很早以前存储很贵,纯汉字存储采用gbk 会比utf8少很多空间。比如几百亿中文网页存储。
: 2.很多老的工具、软件从gb2312开始的,然后一步步演化到现在的。
这个当然
我只是不明白,18030到底比GBK多了什么东西,值得这么做。
按软件版本来衡量,这只是个小升级而已,多了100多个汉字的编码。
至于说变长,真不知道这东西又什么鸟用,现在有谁在用这变长的东东做什么东西了,还是这只是个摆设,也就是个噱头而已。
我的认为是,中文的编码有GBK就足够了
弄出个18030,完全是要走和世界对着干的路子。
你要用自己的标准,GBK没什么问题
剩下的选择,当然是选择UTF-8。
也就是说,如果你强调历史原因,GBK/GB2312,这些都挺好的了
但是在强调历史原因的同时,依旧在历史的路子里大踏步前进,这就说不过去了
目前的操作系统都支持18030,但是有哪个在用18030,又有哪个觉得非18030不行呢?用18030的地方,GBK到底有什么解决不了问题,需要用一个新的标准来解决它们?
--
FROM 221.218.206.*
utf-8的编码设计充满对汉字的歧视,gb18030就证明了2字节表达大多数汉字的变长编码根本不是技术问题。
【 在 fanci 的大作中提到: 】
: 言重了,一个抖音视频够把金庸的所有书都编进去了。
--
FROM 171.221.52.*
照你这么说西方没把常用单词压缩在unicode里已经算不错了
【 在 poocp () 的大作中提到: 】
: utf-8能做到的,gb18030同样也能做到,而且对gb2312全兼容不用任何额外变动,我当然支持gb18030成为国际标准,utf-8就是一个歧视性的编码,中文一个汉字至少3字节,制定国家标准的脑抽了才会同意。而且这里头还有文字主权问题,汉字是需要为未来留够造字空间的,字母文字一般没那个需求,所以这个主动权必须掌握在汉字使用者这边。
:
: 【 在 evilll 的大作中提到: 】
--
FROM 203.145.95.*