这是他的分页实现比较渣,有http协议标准在中间放着,浏览器或者爬虫和后台应用具体技术不可能产生任何直接关系。
至于3秒挂。我怀疑是后端加了限制恶心你,也有可能是后端菜,这个时代,任何领域都有一堆菜鸟在哪儿凑项目,SSH早就是培训班速成内容了。我见过有团队只会SSH,连JSON API也用Struts输出,导致Struts会把JSON内容转换一次编码,于是乎前端拿到JSON还得反转换一次,这已经不是拿着锤头找钉子的问题了,这纯粹属于豆腐渣工程设计
再就是关于这个问题的解决:爬虫在高匿仿真方面必须做到访问周期调度高度灵活可控。
【 在 lokta 的大作中提到: 】
: JSP查询翻页。
: 要保持session,带post form的structs token
: 问题是我三秒爬一次都会出现挂掉。。然后只能重新登录。
: ...................
--
修改:dhcn FROM 123.112.232.*
FROM 123.112.232.*