- 主题:学到一招,蜜罐
前两天我在报怨我的博客被发广告的机器人占领。后来看了一些文章,提到蜜罐这种技术。原理是在表单里面增加一个隐藏的字段。如果这个字段有值,就知道是机器人了。这种办法也可以用来对付那些爬虫,故意设置一个用户和robot.txt里面访问不到的链接。如果被爬虫爬到了,直接封IP。
--
FROM 27.154.193.*
要啥源码。
【 在 SlANmASTer (渴望美女青睐 之 我爱工科女) 的大作中提到: 】
: 贴源码
--
FROM 27.154.193.*
这只是一种原理而已。代码就两行。
【 在 SlANmASTer (渴望美女青睐 之 我爱工科女) 的大作中提到: 】
: 蜜罐
--
FROM 27.154.193.*
密罐的原理wiki上面有。
因为机器人比较笨,以为字段都要填值才能提交。设想一下你自己做广告机器人就知道了。
【 在 BAIYUXIONG (爱情是个屁) 的大作中提到: 】
: 为什么字段有值就是机器人了?
--
FROM 27.154.193.*
现在的机器人哪有像你那样一个个网站抓包过去的。那样人工成本太高了。
何况你还可以搭配验证码来使用。我的博客用的是Google的那种验证码,那些机器人居然都能验证通过。实在太牛逼了。
【 在 BAIYUXIONG (爱情是个屁) 的大作中提到: 】
: 这不科学
: 如果是用户提交这个就没值了吗?
: 我自己抓个包,发现这个没值,我做机器人的时候也不给值,你这个根本没用
: ...................
--
FROM 27.154.193.*
字段的是隐藏的。用户提交的时候不会有值。但是有些机器人不懂得分析字段是不是隐藏的,会随便给你填上几个值。
【 在 BAIYUXIONG (爱情是个屁) 的大作中提到: 】
: 这不科学
: 如果是用户提交这个就没值了吗?
: 我自己抓个包,发现这个没值,我做机器人的时候也不给值,你这个根本没用
: ...................
--
FROM 27.154.193.*