Python 从页面获取带有动态下载链接的文件

Python 从页面获取带有动态下载链接的文件,python,web-scraping,web-crawler,python-requests,Python,Web Scraping,Web Crawler,Python Requests,我需要获取过去2年有关市场数据的所有文件,这些数据在单独URL中的每日xls文件中。例如: 问题源于与文件下载相关的动态链接,即: 有没有办法抓取所有页面(使用日期字段可以轻松完成)并获取每个链接的xls文件 看看我试过的其他问题: import urllib.request response = urllib.request.urlopen('http://www.atsenergo.ru/nreport?rname=trade_zsp&rdate=20150914') conten

我需要获取过去2年有关市场数据的所有文件,这些数据在单独URL中的每日xls文件中。例如:

问题源于与文件下载相关的动态链接,即:

有没有办法抓取所有页面(使用日期字段可以轻松完成)并获取每个链接的xls文件

看看我试过的其他问题:

import urllib.request
response = urllib.request.urlopen('http://www.atsenergo.ru/nreport?rname=trade_zsp&rdate=20150914')
content_type = response.info().get('Content-Type')
print(content_type)

尝试获取'application/octet stream'类型并找到链接,但我只得到'text/html;charset=UTF-8'

首先需要循环查看日期,因此必须设置开始日期(2年前)并逐日添加。 每天您都会请求网页并解析它以获得指向xml文件的链接(当您搜索以xsl结尾的a标记时,这应该很容易)。 然后你有了url,你可以下载给定日期的xls


内容类型不是您想要的。

请说明您迄今为止尝试了哪些内容?一个代码样本将不胜感激。