【求助】怎么避免自己的网站被全站下载盗用

水木社区手机版

主题:【求助】怎么避免自己的网站被全站下载盗用
楼主|TouchUrBody|2008-01-17 20:41:18|展开
一些网站在页面中自动插入许多无意义的字符，怎么实现的？

有没有更好的方式？比如用户可以逐页阅读、单篇复制，但是不能整站下载的？
--
FROM 117.12.251.*
5楼|TouchUrBody|2008-01-17 20:57:58|展开
【在 dhcn (Bipolar|小石) 的大作中提到: 】
: 不知道现在js方式的链接对爬虫工具有效吗？

这这句话是反问还是疑问啊？
--
FROM 117.12.251.*
7楼|TouchUrBody|2008-01-17 21:05:43|展开
【在 kabbesy (Arthas) 的大作中提到: 】
: 不要忘记，爬虫也能像人一样控制浏览器

啊那要是能使返回到浏览器的所有数据不按照常规的字符串，可行么？这样爬虫就不能辨别自己遇到的是什么了
--
FROM 117.12.251.*
10楼|TouchUrBody|2008-01-17 21:07:59|展开
【在 ttl (小驴|主ID) 的大作中提到: 】
: 弄成纯Ajax的，让它爬Json对象或者XML去吧，呵呵。

对这个感兴趣，再详细说下吧～～
--
FROM 117.12.251.*
14楼|TouchUrBody|2008-01-17 22:21:38|展开
【在 kabbesy (Arthas) 的大作中提到: 】
: 基本的爬虫当然是这样
: 但一些高级的爬虫（更多可以认为是采集器）
: 就会使用browser了
: 但一些高级的爬虫（更多可以认为是采集器）
: 就会使用browser了

: 比如控制firefox/mozilla
: java版年后会新开一个开源项目，就叫万能爬虫好了

还是别了，造祸于人类～站长们本来就不容易。
--
FROM 117.12.251.*