Python 透过邮寄表格下载文件
有一个网站有一个我想下载的文件列表。为了简化这个过程,我试着写一个脚本来帮我完成。(尽管我可以同时选择多个选项,但单击“提交”仅下载第一个文件) 网页url webpage/list.php与表单中的操作不同。我不确定在这里发布实际url的政策是什么Python 透过邮寄表格下载文件,python,forms,post,download,Python,Forms,Post,Download,有一个网站有一个我想下载的文件列表。为了简化这个过程,我试着写一个脚本来帮我完成。(尽管我可以同时选择多个选项,但单击“提交”仅下载第一个文件) 网页url webpage/list.php与表单中的操作不同。我不确定在这里发布实际url的政策是什么 <form action="webpage/data.php" method="post"> <table align="center"> <tbody> <tr><td
<form action="webpage/data.php" method="post">
<table align="center">
<tbody>
<tr><td>
<select name="data[]" size="8" multiple="multiple">
<option value="downloadable_file1.tar">Downloadable file1</option>
<option value="downloadable_file2.tar">Downloadable file2</option>
<option value="downloadable_file3.tar">Downloadable file3</option>
</select>
</td></tr>
</tbody>
</table>
<input type="submit">
</form>
当运行脚本时,服务器似乎没有确认请求,只是为我提供带有文件列表的相同网页。有没有我错过的选择?可能有som重定向问题吗
这是我使用Chrome时获得的信息:
Request URL:webpage/data.php
Request Method:POST
Status Code:200 OK
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Charset:ISO-8859-1,utf-8;q=0.7,*;q=0.3
Accept-Encoding:gzip,deflate,sdch
Accept-Language:sv-SE,sv;q=0.8,en-US;q=0.6,en;q=0.4
Cache-Control:max-age=0
Connection:keep-alive
Content-Length:26
Content-Type:application/x-www-form-urlencoded
Host:webpage
Origin:webpage
Referer:webpage/list.php
User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_8) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22
data[]:downloadable_file1.tar
Accept-Ranges:bytes
Cache-control:private
Connection:Keep-Alive
Content-Disposition:attachment; filename="downloadable_file1.tar.gz"
Content-Length:1043436
Content-Transfer-Encoding:binary
Content-Type:application/x-gzip
Date:Tue, 26 Mar 2013 20:18:58 GMT
Expires:Mon, 26 Jul 1997 05:00:00 GMT
Keep-Alive:timeout=5, max=100
Pragma:private
Server:Apache/2.2.9 (FreeBSD) mod_ssl/2.2.9 OpenSSL/0.9.7e-p1 DAV/2 PHP/5.2.6 with Suhosin-Patch
X-Powered-By:PHP/5.2.6
该行:
req = urllib2.Request('webpage/list.php')
正在请求原始网页,但表单将数据发布到webpage/data.php
。这个效果更好吗
req = urllib2.Request('webpage/data.php')
您应该考虑使用“请求”库: 我相信这将通过使用请求库实现:
data={'data[]':'downloadable_file1.tar'}
req = requests.post('webpage/data.php', data)
with open('file.data', 'wb') as file:
file.write(req.content)
data={'data[]':'downloadable_file1.tar'}
req = requests.post('webpage/data.php', data)
with open('file.data', 'wb') as file:
file.write(req.content)