【 在 chentingpc (Airobot) 的大作中提到: 】
: 标 题: 【抓数据时候遇到需要HTTPS登录以及JS脚本问题】
: 发信站: 水木社区 (Mon Dec 3 12:24:06 2012), 站内
:
: 1.抓数据的时候需要登录,比如
http://slashdot.org/~Vanderhoth/friends。并且登录是用https协议,解决方法有自动登录以及cookie欺骗等。想问下https的自动登录应该怎么写呢(最好能用scrapy)?
没做过
: 2.如果遇到JS脚本来加载数据的情况,大家是怎么处理的呢?
分析请求数据的 URL,请求这个 URL,解析得到的数据
: --
:
: ※ 来源:·水木社区
http://www.newsmth.net·[FROM: 74.125.185.*]
--
FROM 114.249.220.*