Python 避免使用硒
我试着用Selenium chromedriver来处理网页垃圾,但每次我都要解决5-8个问题。 当我用谷歌浏览器手动访问同一个网站时,我甚至连一个验证码都没有。 我不使用无头选项。。。Python 避免使用硒,python,selenium,web-scraping,selenium-chromedriver,recaptcha,Python,Selenium,Web Scraping,Selenium Chromedriver,Recaptcha,我试着用Selenium chromedriver来处理网页垃圾,但每次我都要解决5-8个问题。 当我用谷歌浏览器手动访问同一个网站时,我甚至连一个验证码都没有。 我不使用无头选项。。。 有没有办法避免这些验证码?或者一次请求最多获得1-2个验证码?我的意思是,对我来说,解决验证码不是问题,但连续5-8个验证码需要花费很多时间。有像2captcha这样的验证码解决程序,它们在每次验证码15-40秒左右就能解决问题。验证码是用来检测各种形状和形式的机器人,以及。。。这就是它所做的。答案很简单:不,
有没有办法避免这些验证码?或者一次请求最多获得1-2个验证码?我的意思是,对我来说,解决验证码不是问题,但连续5-8个验证码需要花费很多时间。有像2captcha这样的验证码解决程序,它们在每次验证码15-40秒左右就能解决问题。验证码是用来检测各种形状和形式的机器人,以及。。。这就是它所做的。答案很简单:不,没有旁路
有一些变通方法可以避免整个系统,比如使用alt登录,比如可能使用不同API的应用程序。这可以通过类似于selenium的appium来实现,也可以通过使用HTTPRequest库来实现。检查您的请求头,特别是user-agent。接受提示。他们不希望你的机器人出现在他们的网站上。尊重他们的意愿,继续前进。