- 主题:发帖编码问题
你咋知道是utf8的
【 在 hrpenf (平静的接受失败) 的大作中提到: 】
: 一个网页的编码一般在网页里面有写,
: 我想知道的是比如发帖子发送的内容的编码是怎么确定的?
: 比如baidu贴吧的网页是gbk的,但是发帖子中汉字的编码确实utf8
: 这个是怎么回事?
--
FROM 202.106.68.*
js里转换不大可能,我想你的意思是发贴这个请求的编码是utf8,而贴吧的页面编码是gbk,那很显然是百度的服务器在接收请求后做了转换,否则你抓到的也应该是utf8。
【 在 hrpenf (平静的接受失败) 的大作中提到: 】
: 抓包分析的,
: 不过查了一下,好像是发帖的时候js里面做了转换
--
FROM 202.106.68.*
除非设置了form的accept-charset,否则应当是跟发起post的页面编码一致的
【 在 hrpenf (平静的接受失败) 的大作中提到: 】
: 我不懂js,只是猜是js转的
: 但是抓包看从本机发出的post数据内容是utf8编码+quote的
: 我现在是不明白为什么数据内容是utf8,感觉上应该和网页编码一致
: ...................
--
FROM 202.106.68.*
那要么你发起post的页面本身是utf8的,要么你抓到的东西根本不是utf8编码的
【 在 hrpenf (平静的接受失败) 的大作中提到: 】
: 看了文件源代码还真没有发现设置了这个
: 不知道怎么实现的
--
FROM 202.106.68.*
tieba不是用form提交的,而是在js里做了主动的encodeURIComponent,这个时候不存在gbk到utf8的问题,只是由js引擎的默认编码(一般都是unicode吧)转到utf8。
用form提交,才会默认跟页面编码保持一致。
【 在 hrpenf (平静的接受失败) 的大作中提到: 】
: 百度tieba的页面容易看到是gbk
: 而post内容是类似 %E9%AD%94%E5%85%BD
: 这个正是魔兽的utf8编码
: ...................
--
FROM 202.106.68.*