Python 编译web表单并使用mechanize检索文件

Python 编译web表单并使用mechanize检索文件,python,html,forms,mechanize,Python,Html,Forms,Mechanize,我需要以自动方式提取此网站中的所有文件: 在该网站中,有一个web表单,其中包含要设置的组合框和复选框,以及执行下载xls文件的按钮 我发现mechanize是一个很好的python库,可以帮助我自动化这项任务。 我可以将组合框配置为用html打开结果页,但我不知道如何下载xls文件。有什么建议吗 非常感谢 #my code from mechanize import Browser br = Browser() page = br.open("http://www.coeweb.istat.

我需要以自动方式提取此网站中的所有文件:

在该网站中,有一个web表单,其中包含要设置的组合框和复选框,以及执行下载xls文件的按钮

我发现mechanize是一个很好的python库,可以帮助我自动化这项任务。 我可以将组合框配置为用html打开结果页,但我不知道如何下载xls文件。有什么建议吗

非常感谢

#my code
from mechanize import Browser

br = Browser()
page = br.open("http://www.coeweb.istat.it/predefinite/tutto_paese_merce.asp?livello=ATE07_AT2&riga=MERCE&territorio=S&AG=S")

br.select_form(nr=0)
control_xls = br.form.find_control("XLS")
br.find_control("XLS").items[0].selected=True
control = br.form.find_control("CODTERRITORIO")    
control.items[0]
print control.value
print control
#select Florence
control.value = ["309048"]
print control
br[control.name] = ["309048"]
response = br.submit()

out_file = open("dataset.html", "w")
out_file.write(response.read())
out_file.close()

将要写入的文件的扩展名从.html更改为.xls

from mechanize import Browser

br = Browser()
br.open("http://www.coeweb.istat.it/predefinite/tutto_paese_merce.asp?livello=ATE07_AT2&riga=MERCE&territorio=S&AG=S")

br.select_form(nr=0)
br.find_control("XLS").items[0].selected = True
br.find_control("CODTERRITORIO").value = ["309048"]
response = br.submit()

with open("dataset.xls", "w") as xls_file:
    xls_file.write(response.read())

什么是我的问题,似乎代码是工作?我还需要下载xls文件,但我不知道如何做到这一点。(现在我可以用pandas从html中提取表,但我喜欢学习避免这个技巧)