Python在登录的网站上读取源代码
我需要从需要loggin的网站中提取源代码。 我可以通过单击链接访问和打开该网页,因为我以前已经登录该网页,并且有存储的cookie 但是,如果我尝试使用具有相同链接的pythonPython在登录的网站上读取源代码,python,urllib2,urllib,Python,Urllib2,Urllib,我需要从需要loggin的网站中提取源代码。 我可以通过单击链接访问和打开该网页,因为我以前已经登录该网页,并且有存储的cookie 但是,如果我尝试使用具有相同链接的python import urllib link = "http://www.somesite.com/details.pl?urn=2344" f = urllib.urlopen(link) myfile = f.read() print myfile 结果总是返回登录页面的源代码 有人能帮我吗?非常感谢 更新1.0:
import urllib
link = "http://www.somesite.com/details.pl?urn=2344"
f = urllib.urlopen(link)
myfile = f.read()
print myfile
结果总是返回登录页面的源代码
有人能帮我吗?非常感谢
更新1.0:
我已经尝试了itsneo提供的,它与我的Reddit帐户完美配合。但是,在我更新用户名、密码和URL(仔细检查这些值)之后,我仍然停留在我想要访问的登录页面上
以下是我试图访问的登录页面,是否需要向该页面添加任何附加属性
主动计费
用户名:
密码:
这有帮助吗?如果您使用浏览器登录,则cookie位于浏览器中;你的Python对此一无所知。用于轻松与Python中的网页进行交互,包括登录和随后使用cookie。我个人建议使用请求库,而不是使用级别低得多的urllib-请求具有“会话”,它将在whatjamacallit,哦,是的,会话中保存cookie。请参阅-有关会话的更多信息-有关身份验证的更多信息,您不能在浏览器中打开该页面,进行身份验证,然后保存该页面吗?感谢所有回复,@itsno您能帮我更新新的内容吗
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
<head>
<title></title>
<link href="/stylesheets/ab.css?1447805380" media="screen" rel="stylesheet" type="text/css" />
<link href="/stylesheets/login.css?1412579810" media="screen" rel="stylesheet" type="text/css" />
</head>
<body>
<span class="centerblockabsolute login">
<div class="base-layer">
<div id="banner">
active billing
</div>
<form action="/login/login" method="post">
<div id="leftcontent">
<div>
</div>
<span class="error"></span><br />
<table>
<tr>
<td><label for="username">user name:</td>
<td><input id="username" name="username" size="20" type="text" /></td>
</tr>
<tr>
<td><label for="passsword">Password: </label></td>
<td><input id="password" name="password" size="22" type="password" /></td>
</tr>
<tr>
<td align="right" colspan="2">
<input name="submit" src="/images/buttons/login.gif?1412579810" type="image" value="submit" />
</td>
</tr>
</table>
</div>
<div id="rightcontent">
<img alt="Logo-ab" src="/images/logo-ab.png?1412579810" />
<input id="redirect_url" name="redirect_url" type="hidden" value="https://eutility.activebilling.com.au/" />
</div>
</form>
</div>
</span>
</body>
</html>