- 主题:想请人这一个爬虫,请报价
慢慢爬取一般性的网页上能看到的信息,自己存起来用,一般没有问题。
如果爬狠了影响了服务器,就是破坏计算机信息系统罪;
如果爬了手机号等个人信息,就违反了个人信息保护法;
如果爬取的资料卖钱了,罪名就更丰富了。
--
FROM 221.218.5.*
第一句描述了爬虫不犯法的场景。
爬虫可以模拟的和正常浏览一模一样。如果要加码,慎重调节相关参数。
【 在 greatshine 的大作中提到: 】
: 现在做科研不也用爬虫吗?难道这个也犯法吗?
: 发自「今日水木 on M2104K10AC」
--
FROM 221.218.5.*
同IP访问总量也能监控的到。
【 在 Rij 的大作中提到: 】
: 嗯,频率不要太快,半分钟开一个页面应该问题不大
: :
--
FROM 221.218.5.*
不犯法,但是有特征的访问,服务端可以监控和屏蔽掉。
【 在 vole 的大作中提到: 】
: 不会吧,那我写的自动挂号脚本也犯法吗?就是不停刷有没有号的那种
--
FROM 221.218.5.*