使用python和urllib2如何在阅读源代码之前对网页进行身份验证

使用python和urllib2如何在阅读源代码之前对网页进行身份验证,python,authentication,Python,Authentication,好的,我有一个代码,可以从网页中读取并解析源代码,从而在我的谷歌adsense账户中找到金额。“读取自”部分如下所示: import urllib2 import re s = urllib2.urlopenopen('https://www.google.com/adsense/report/overview?timePeriod=alltime').read() results = re.findall('[$][1-9][1-9][1-9][.][1-9][1-9]',s) print r

好的,我有一个代码,可以从网页中读取并解析源代码,从而在我的谷歌adsense账户中找到金额。“读取自”部分如下所示:

import urllib2
import re
s = urllib2.urlopenopen('https://www.google.com/adsense/report/overview?timePeriod=alltime').read()
results = re.findall('[$][1-9][1-9][1-9][.][1-9][1-9]',s)
print results

因此,代码运行良好,除了要访问我的帐户,我必须登录(duh),但我的问题是,我不知道如何使用python在登录页面进行身份验证,然后转到帐户页面。我只需要知道如何进行身份验证,然后转到显示我的帐户信息的页面,顺便说一句,我正在使用python 2.7,非常感谢

网页身份验证由网站决定,可以通过多种方式完成,您通常需要向请求添加标题或cookie。这些标题的外观同样取决于Web应用程序,如果您使用http或https,那么当您转到登录页面时,通常会返回cookie,这意味着您需要向登录页面发出请求并跟踪这些cookie


因此,在我们告诉您如何使用Python之前,您应该先了解如何使用Python。google adsense身份验证是如何工作的?

我打赌有一个python库可以用来登录google服务。也许你可以劫持它供你使用?

我担心,如果你想为你要做的事情找到简单的解决方案,你会很幸运

首先,urllib2没有
open
方法。您可能正在尝试的是
urllib2.urlopen

您可能首先想了解有关使用urllib2进行身份验证的更多信息。提供了一些信息

在您针对google adsense进行身份验证的具体案例中,在启动基于摘要的身份验证方法之前,您必须找出google adsense希望进行身份验证的URL和cookie。有人也尝试过这样做,但运气不好

以编程方式从Google获取数据的最佳方法是使用他们的API,在本例中,列出了,您可能希望使用它来反省并获得所需的信息。

您可以尝试使用一个类似于浏览器的第三方包

这样做的想法是让mechanize来填写通常在浏览器上手动填写的身份验证表单