写了个网路爬虫抓百度的链接
http://video.baidu.com/topgame/?game_type=&game_category=&pn=3时发现返送回来的内容好像被添加了一下数字,比如有一个片段
<li class="li "><a href="http://video.baidu.com/childchannal/xiaopin/xiaopin.html" >
f08
相声小品</a></li>
直接用IE看到的片段应该是
<li class="li "><a href="http://video.baidu.com/childchannal/xiaopin/xiaopin.html" >相声小品</a></li>
求教这个f08是为啥加上去的?它的生成规则是什么?怎么去的返回数据包里的这些噪声?
多谢!
--
FROM 207.46.92.*