Python 如何使用web刮板预先解决reCaptcha问题？_Python_Python 2.7_Web Scraping_Recaptcha

Python 如何使用web刮板预先解决reCaptcha问题？

python python-2.7 web-scraping

Python 如何使用web刮板预先解决reCaptcha问题？,python,python-2.7,web-scraping,recaptcha,Python,Python 2.7,Web Scraping,Recaptcha,我目前正在努力解决一个问题。收到的建议之一是一种称为代币农业的方法例如，可以从另一个站点进行reCaptcha令牌的农场，并在2分钟内，通过更改站点背面的代码，将其中一个农场令牌应用到我试图解决的站点不幸的是，我们无法得到任何关于如何继续这样做的进一步解释，特别是更改网站背面的代码如果有人能够详细阐述或提供有关该过程的见解，将非常感谢您的专业知识。代币农业/代币收获在这里有详细描述：本文讨论的“代币农业”方法基于以下机制：使用recaptcha访问站点的每个用户都被分配了一个recap

我目前正在努力解决一个问题。收到的建议之一是一种称为代币农业的方法

例如，可以从另一个站点进行reCaptcha令牌的农场，并在2分钟内，通过更改站点背面的代码，将其中一个农场令牌应用到我试图解决的站点

不幸的是，我们无法得到任何关于如何继续这样做的进一步解释，特别是更改网站背面的代码

如果有人能够详细阐述或提供有关该过程的见解，将非常感谢您的专业知识。

代币农业/代币收获在这里有详细描述：

本文讨论的“代币农业”方法基于以下机制：

使用recaptcha访问站点的每个用户都被分配了一个

recaptcha令牌

此令牌用于在多次站点访问中识别用户，并将其标记为合法（或非法）用户

根据各种因素，如recaptcha令牌的年龄、用户行为和浏览器配置，每次访问时，用户要么会看到不同的recaptcha版本，要么甚至根本没有验证码（更多详细信息可从此处的代码中提取：）

这意味着，如果可以为目标站点创建大量新鲜干净的令牌，并将其老化9天（这是本文发现的），那么这些令牌可以用于访问几个受保护的站点，然后再查看recaptcha

据我所知，这样一个新的令牌必须作为Cookie传递给相关站点

不过，我记得我曾在某处读到，谷歌在本次演讲后几天内就填补了这一空白

此外，很可能还有其他类似的方法被称为“代币农业”

据我所知，所有这些方法都利用了recaptcha系统中的漏洞，这些漏洞被谷歌很快地填补了——甚至在论文或演示文稿公开之前，因为负责任的作者通常会提前通知谷歌

因此，对于您来说，这很可能仅具有学术价值，或者用于学习captcha系统和基于令牌的服务的适当保护

更新

对几个受recaptcha保护的站点的快速检查表明，当前系统现在会对cookie进行置乱，但recaptcha令牌可以在recaptcha表单中找到，作为两个隐藏的输入元素，具有部分不同的值和id=“recaptcha令牌”

使用干净的浏览器访问此类页面时，您将获得一个新的recaptcha令牌，您可以将其保存起来，并在以后需要时插入到相同的表单中。至少这是理论，很有可能浏览器中的所有cookie和一些长期存在的东西都会阻止你这样做。

澄清一下，你是否向人类提出验证码挑战，然后尝试在网站中使用验证码保护的解决方案，在自动的基础上？看起来像是试图闯入验证码system@halfer我被告知，您可以在一个站点解决reCaptcha并检索已解决的令牌，如果我要使用reCaptcha访问另一个站点，则在2分钟内，我可以使用先前已解决的reCaptcha令牌来解决当前的reCaptcha。我的意思是，您想要的看起来不正确且不公平。你为什么需要它？我认为这是大多数阅读此问题的用户都想知道的。@Andrewchervatkin：我认为在这里讨论黑客是可以的，因为我们不知道OP（或后续读者）的目的是好是坏。这已经在Meta站点上讨论过几次了。然而，这里没有提出任何尝试，因此可能会以“过于宽泛”来结束。请欣赏这些见解。事实上，我确实看过该文件，但没有详细说明如何实施该文件。这是为了学习，相信还是有漏洞的。因此，我想尝试一下，但不确定改变网站背面代码的建议意味着什么。它是指HTML页面源代码吗？确实尝试过，但没有更改任何内容。在我的答案中添加了详细信息，令牌必须作为cookie传递到站点。然而，您将无法复制本演示文稿中的任何结果，因为谷歌去年填补了这个漏洞。非常感谢您的洞察力！我对学习很感兴趣。为澄清起见，

recaptcha令牌

是否保存为web令牌？将新令牌作为cookie传递的过程是什么？这是否意味着，用户解决了一个reCaptcha，这将在存储器中存储一个web令牌。然后，只需转到目标reCaptcha站点，即将令牌作为cookie传递，因为令牌仍将在存储中？这就是它过去的工作方式，快速检查当前reCaptcha站点并相应更新我的答案。再次感谢您的回复！我确实知道你所描述的事实。通过保存，您指的是web存储，对吗？你能详细解释一下插入到同一个表格中的内容吗？这部分我一直不明白？您的意思是使用web存储中的新reCaptcha令牌手动更改源页面吗？