- 主题:【求助】怎么避免自己的网站被全站下载盗用
起码一点:爬虫可以搞定js方式的链接
【 在 dhcn (Bipolar|小石) 的大作中提到: 】
: 不知道现在js方式的链接对爬虫工具有效吗?
--
FROM 221.218.128.*
不要忘记,爬虫也能像人一样控制浏览器
【 在 luckwithme (Marvel) 的大作中提到: 】
: 不见的
: 把关键的内容放在数组中,用js组装成url,参考smth的同主题阅读……
--
FROM 221.218.128.*
基本的爬虫当然是这样
但一些高级的爬虫(更多可以认为是采集器)
就会使用browser了
比如控制firefox/mozilla
java版年后会新开一个开源项目,就叫万能爬虫好了
【 在 dhcn (Bipolar|小石) 的大作中提到: 】
: 据一个同事说:他有朋友做爬虫之类的工具,一般爬虫为了效率,采用的接口都是很底层的那种,没有到浏览器这种量级。
--
修改:kabbesy FROM 221.218.128.*
FROM 221.218.128.*