Web scraping 如何使用IP阻止来防止站点刮取？_Web Scraping_Screen Scraping_Tor

Web scraping 如何使用IP阻止来防止站点刮取？

web-scraping

Web scraping 如何使用IP阻止来防止站点刮取？,web-scraping,screen-scraping,tor,Web Scraping,Screen Scraping,Tor,我们的网站面临多重攻击。我们基本上是分类商品网站，帮助客户相互联系机器人每天都通过提供假手机号码从我们的网站窃取数据。我们没有登录机制。用户必须共享其联系号码才能获取其他用户的联系详细信息我读了这篇问答文章智能机器人可以轻松避免移动到robots.txt中列出的文件、更改cookie和更改用户代理即使使用captcha，他们也可以通过手动输入任意随机数来窃取数据如果每天超过x条线索，我们计划将线索标记为可疑。这里的问题是，bot可以使用像TOR这样的服务来生成无限的IP。我们如何解决这

我们的网站面临多重攻击。我们基本上是分类商品网站，帮助客户相互联系

机器人每天都通过提供假手机号码从我们的网站窃取数据。我们没有登录机制。用户必须共享其联系号码才能获取其他用户的联系详细信息

我读了这篇问答文章

智能机器人可以轻松避免移动到robots.txt中列出的文件、更改cookie和更改用户代理

即使使用captcha，他们也可以通过手动输入任意随机数来窃取数据

如果每天超过x条线索，我们计划将线索标记为可疑。这里的问题是，bot可以使用像TOR这样的服务来生成无限的IP。我们如何解决这个问题，也就是说，如果他们有无限的IP地址和无限的数量，那么解决这个问题的方法是什么

除了设置OTP，我们欢迎所有建议，因为我们已经考虑到了这一点。

Tor目前只有大约900-1000个IP，远远不是无限的。如果你要求用户分享他们的联系电话号码以获取其他详细信息，为什么不向该手机发送短信以进行验证呢？如果他们不能提供一个真实的电话号码，那么他们就无法继续工作。或者让人们注册，或者将给定的IP限制为每小时/天/周期的请求数。您最好的选择是具有防DDoS功能的CDN。云焰，云雾，蒸馏器——其中之一。