- 主题:看了看GB18030,是人是鬼还是神?
有,Unicode全覆盖,用不用还是得看国家的国际影响力,现在不用不等于以后也没别的国家用。
UTF-8有的GB18030都有,而且汉字的字节占用更合理。
【 在 DreamDreams 的大作中提到: 】
: GB18030有汉字之外的其他语言的字符么?没有就不会有人用,大家为了方便肯定
: 是要追求用一个所有人都能用的编码,UTF-8就是这种。
:
: ...................
--
FROM 171.221.52.*
gb18030是国家强制标准,不用我发明了,utf-8程序员自己写代码用没人过问,脑抽了去反对gb18030推utf-8自然有人过问也用不着我操心。
【 在 shootings 的大作中提到: 】
: 嗯,你应该发明一个编码
: 这个编码应该将ASCII发到三字节那儿去
: 将最宝贵的一字节拿来存储咋们的最常见汉字
--
FROM 171.221.52.*
Tim Bray原话
UTF-8 is kind of racist. It allows us roundeye paleface anglophone types to tuck our characters neatly into one byte, lets most people whose languages are headquartered west of the Indus river get away with two bytes per, and penalizes India and points east by requiring them to use three bytes per character.
【 在 beckyer 的大作中提到: 】
: 不觉得UTF-8对汉字有什么歧视。
: :
--
修改:poocp FROM 171.221.52.*
FROM 171.221.52.*
是不是合情合理,你说了不算。
【 在 beckyer 的大作中提到: 】
: 这话没什么道理。
: UTF-8是全球文字编码,汉字数量巨大,三个字节代表一个汉字合情合理。
--
FROM 171.221.52.*
不要拿结果证明其合理性,UTF-8这个编码方案就是垃圾设计。
【 在 beckyer 的大作中提到: 】
: UTF-8的双字节码位只有1920个,连GB2312一级汉字都放不进。凭什么把UTF8的双字节分配给汉字?
: 在这瞎扯淡,为什么不找些UTF8的资料读读?
--
FROM 171.221.52.*
我认为GB18030编码合情合理。
【 在 beckyer 的大作中提到: 】
: 那你来设计一个:
: 支持各国文字,兼容ascii(不是GB18030的0x8140这种弱智编码),良好的纠错性。
:
--
FROM 171.221.52.*
gb18030也是全球通用,你随便把任何一张utf-8混合多种语言文本的网页转码gb18030,一切显示正常。
【 在 Qlala 的大作中提到: 】
: utf8 本来写个软件全球通用 你倒好..
: 这玩意跟中国墙有什么本质区别?
: :
--
FROM 171.221.52.*
这个是美国灭亡之后的事了,现阶段追求的是对等公平,常用汉字2字节存储既合理,且公平。utf8设计时恶意将双字节编码的码位数量定为1920个,排挤汉字编码到3字节,既不合理,更不公平。
【 在 shootings 的大作中提到: 】
: gb18030一个字节用作ASCII,这个不是想西方社会低头了吗?这个标准按照你对于utf8歧视汉字来说,你应该强烈反对啊。
:
--
FROM 171.221.52.*
utf-16不兼容ascii,而且还分大头小头两种。
变长编码是最合理效率的,gb18030集中了utf-8 utf-16 utf-32的优点,且对汉字存储公平,全兼容gb2312,过去的中文文档不用做任何转码,能支持全世界文字。
【 在 hgoldfish 的大作中提到: 】
: 对了。为啥国内不流行 utf-16,这个对于汉字是不是比较公平。
:
--
修改:poocp FROM 171.221.52.*
FROM 171.221.52.*
行了,你的立场已经表达清楚了,没点新意的话我就不回了。
【 在 shootings 的大作中提到: 】
: 对等公平?人家用一个字节就表达了,你还得用2个字节(2个字节肯定不能够完全编码,你还得用3个字节),这个叫做哪门子公平。
: 建议将比如说“xi”,“大”之类的放入一个字节中编码。编码这事为啥需要等到“美国灭亡”之后再做,这样子才能够扬我国威。
:
--
FROM 171.221.52.*