Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用web刮板预先解决reCaptcha问题?_Python_Python 2.7_Web Scraping_Recaptcha - Fatal编程技术网

Python 如何使用web刮板预先解决reCaptcha问题?

Python 如何使用web刮板预先解决reCaptcha问题?,python,python-2.7,web-scraping,recaptcha,Python,Python 2.7,Web Scraping,Recaptcha,我目前正在努力解决一个问题。收到的建议之一是一种称为代币农业的方法 例如,可以从另一个站点进行reCaptcha令牌的农场,并在2分钟内,通过更改站点背面的代码,将其中一个农场令牌应用到我试图解决的站点 不幸的是,我们无法得到任何关于如何继续这样做的进一步解释,特别是更改网站背面的代码 如果有人能够详细阐述或提供有关该过程的见解,将非常感谢您的专业知识。代币农业/代币收获在这里有详细描述: 本文讨论的“代币农业”方法基于以下机制: 使用recaptcha访问站点的每个用户都被分配了一个recap

我目前正在努力解决一个问题。收到的建议之一是一种称为代币农业的方法

例如,可以从另一个站点进行reCaptcha令牌的农场,并在2分钟内,通过更改站点背面的代码,将其中一个农场令牌应用到我试图解决的站点

不幸的是,我们无法得到任何关于如何继续这样做的进一步解释,特别是更改网站背面的代码


如果有人能够详细阐述或提供有关该过程的见解,将非常感谢您的专业知识。

代币农业/代币收获在这里有详细描述:

本文讨论的“代币农业”方法基于以下机制:

  • 使用recaptcha访问站点的每个用户都被分配了一个
    recaptcha令牌
  • 此令牌用于在多次站点访问中识别用户,并将其标记为合法(或非法)用户
  • 根据各种因素,如recaptcha令牌的年龄、用户行为和浏览器配置,每次访问时,用户要么会看到不同的recaptcha版本,要么甚至根本没有验证码 (更多详细信息可从此处的代码中提取:)

    这意味着,如果可以为目标站点创建大量新鲜干净的令牌,并将其老化9天(这是本文发现的),那么这些令牌可以用于访问几个受保护的站点,然后再查看recaptcha

    据我所知,这样一个新的令牌必须作为Cookie传递给相关站点

    不过,我记得我曾在某处读到,谷歌在本次演讲后几天内就填补了这一空白

    此外,很可能还有其他类似的方法被称为“代币农业”

    据我所知,所有这些方法都利用了recaptcha系统中的漏洞,这些漏洞被谷歌很快地填补了——甚至在论文或演示文稿公开之前,因为负责任的作者通常会提前通知谷歌

    因此,对于您来说,这很可能仅具有学术价值,或者用于学习captcha系统和基于令牌的服务的适当保护

    更新

    对几个受recaptcha保护的站点的快速检查表明,当前系统现在会对cookie进行置乱,但recaptcha令牌可以在recaptcha表单中找到,作为两个隐藏的输入元素,具有部分不同的值和id=“recaptcha令牌”


    使用干净的浏览器访问此类页面时,您将获得一个新的recaptcha令牌,您可以将其保存起来,并在以后需要时插入到相同的表单中。至少这是理论,很有可能浏览器中的所有cookie和一些长期存在的东西都会阻止你这样做。

    澄清一下,你是否向人类提出验证码挑战,然后尝试在网站中使用验证码保护的解决方案,在自动的基础上?看起来像是试图闯入验证码system@halfer我被告知,您可以在一个站点解决reCaptcha并检索已解决的令牌,如果我要使用reCaptcha访问另一个站点,则在2分钟内,我可以使用先前已解决的reCaptcha令牌来解决当前的reCaptcha。我的意思是,您想要的看起来不正确且不公平。你为什么需要它?我认为这是大多数阅读此问题的用户都想知道的。@Andrewchervatkin:我认为在这里讨论黑客是可以的,因为我们不知道OP(或后续读者)的目的是好是坏。这已经在Meta站点上讨论过几次了。然而,这里没有提出任何尝试,因此可能会以“过于宽泛”来结束。请欣赏这些见解。事实上,我确实看过该文件,但没有详细说明如何实施该文件。这是为了学习,相信还是有漏洞的。因此,我想尝试一下,但不确定改变网站背面代码的建议意味着什么。它是指HTML页面源代码吗?确实尝试过,但没有更改任何内容。在我的答案中添加了详细信息,令牌必须作为cookie传递到站点。然而,您将无法复制本演示文稿中的任何结果,因为谷歌去年填补了这个漏洞。非常感谢您的洞察力!我对学习很感兴趣。为澄清起见,
    recaptcha令牌
    是否保存为web令牌?将新令牌作为cookie传递的过程是什么?这是否意味着,用户解决了一个reCaptcha,这将在存储器中存储一个web令牌。然后,只需转到目标reCaptcha站点,即将令牌作为cookie传递,因为令牌仍将在存储中?这就是它过去的工作方式,快速检查当前reCaptcha站点并相应更新我的答案。再次感谢您的回复!我确实知道你所描述的事实。通过保存,您指的是web存储,对吗?你能详细解释一下插入到同一个表格中的内容吗?这部分我一直不明白?您的意思是使用web存储中的新reCaptcha令牌手动更改源页面吗?