Web scraping 如何使用IP阻止来防止站点刮取?

Web scraping 如何使用IP阻止来防止站点刮取?,web-scraping,screen-scraping,tor,Web Scraping,Screen Scraping,Tor,我们的网站面临多重攻击。我们基本上是分类商品网站,帮助客户相互联系 机器人每天都通过提供假手机号码从我们的网站窃取数据。我们没有登录机制。用户必须共享其联系号码才能获取其他用户的联系详细信息 我读了这篇问答文章 智能机器人可以轻松避免移动到robots.txt中列出的文件、更改cookie和更改用户代理 即使使用captcha,他们也可以通过手动输入任意随机数来窃取数据 如果每天超过x条线索,我们计划将线索标记为可疑。这里的问题是,bot可以使用像TOR这样的服务来生成无限的IP。我们如何解决这

我们的网站面临多重攻击。我们基本上是分类商品网站,帮助客户相互联系

机器人每天都通过提供假手机号码从我们的网站窃取数据。我们没有登录机制。用户必须共享其联系号码才能获取其他用户的联系详细信息

我读了这篇问答文章

智能机器人可以轻松避免移动到robots.txt中列出的文件、更改cookie和更改用户代理

即使使用captcha,他们也可以通过手动输入任意随机数来窃取数据

如果每天超过x条线索,我们计划将线索标记为可疑。这里的问题是,bot可以使用像TOR这样的服务来生成无限的IP。我们如何解决这个问题,也就是说,如果他们有无限的IP地址和无限的数量,那么解决这个问题的方法是什么


除了设置OTP,我们欢迎所有建议,因为我们已经考虑到了这一点。

Tor目前只有大约900-1000个IP,远远不是无限的。如果你要求用户分享他们的联系电话号码以获取其他详细信息,为什么不向该手机发送短信以进行验证呢?如果他们不能提供一个真实的电话号码,那么他们就无法继续工作。或者让人们注册,或者将给定的IP限制为每小时/天/周期的请求数。您最好的选择是具有防DDoS功能的CDN。云焰,云雾,蒸馏器——其中之一。