- 主题:【求助】怎么避免自己的网站被全站下载盗用
一些网站在页面中自动插入许多无意义的字符,怎么实现的?
有没有更好的方式?比如用户可以逐页阅读、单篇复制,但是不能整站下载的?
--
FROM 117.12.251.*
【 在 dhcn (Bipolar|小石) 的大作中提到: 】
: 不知道现在js方式的链接对爬虫工具有效吗?
这 这句话是反问还是疑问啊?
--
FROM 117.12.251.*
【 在 kabbesy (Arthas) 的大作中提到: 】
: 不要忘记,爬虫也能像人一样控制浏览器
啊 那要是能使返回到浏览器的所有数据不按照常规的字符串,可行么?这样爬虫就不能辨别自己遇到的是什么了
--
FROM 117.12.251.*
【 在 ttl (小驴|主ID) 的大作中提到: 】
: 弄成纯Ajax的,让它爬Json对象或者XML去吧,呵呵。
对这个感兴趣,再详细说下吧~~
--
FROM 117.12.251.*
【 在 kabbesy (Arthas) 的大作中提到: 】
: 基本的爬虫当然是这样
: 但一些高级的爬虫(更多可以认为是采集器)
: 就会使用browser了
: 但一些高级的爬虫(更多可以认为是采集器)
: 就会使用browser了
: 比如控制firefox/mozilla
: java版年后会新开一个开源项目,就叫万能爬虫好了
还是别了,造祸于人类~站长们本来就不容易。
--
FROM 117.12.251.*