科学家做过实验,把每个主流语言版本的圣经用
各种文本算法压缩,最难压缩的是中文,说明
中文的信息熵最高.
这个比例是以英文压缩之后的圣经为标准样本.
English 1
Spanish 1.006
French 1.026
Chinese 0.899
Korean 0.941
Arabic 1.090
Japanese 1.170
Russian 1.002
【 在 computec 的大作中提到: 】
: 一个中文通常占2字母横向空间 一个词通常占4字母 所以横向确实短了
: 但横向短了就叫简洁吗
: 2个字母算700种组合
: ...................
--
修改:armor FROM 114.248.127.*
FROM 114.248.127.*