Python 从页面获取带有动态下载链接的文件_Python_Web Scraping_Web Crawler_Python Requests

Python 从页面获取带有动态下载链接的文件

python web-scraping web-crawler

Python 从页面获取带有动态下载链接的文件,python,web-scraping,web-crawler,python-requests,Python,Web Scraping,Web Crawler,Python Requests,我需要获取过去2年有关市场数据的所有文件，这些数据在单独URL中的每日xls文件中。例如：问题源于与文件下载相关的动态链接，即：有没有办法抓取所有页面（使用日期字段可以轻松完成）并获取每个链接的xls文件看看我试过的其他问题： import urllib.request response = urllib.request.urlopen('http://www.atsenergo.ru/nreport?rname=trade_zsp&rdate=20150914') conten

我需要获取过去2年有关市场数据的所有文件，这些数据在单独URL中的每日xls文件中。例如：

问题源于与文件下载相关的动态链接，即：

有没有办法抓取所有页面（使用日期字段可以轻松完成）并获取每个链接的xls文件

看看我试过的其他问题：

import urllib.request
response = urllib.request.urlopen('http://www.atsenergo.ru/nreport?rname=trade_zsp&rdate=20150914')
content_type = response.info().get('Content-Type')
print(content_type)

尝试获取'application/octet stream'类型并找到链接，但我只得到'text/html；charset=UTF-8'

首先需要循环查看日期，因此必须设置开始日期（2年前）并逐日添加。每天您都会请求网页并解析它以获得指向xml文件的链接（当您搜索以xsl结尾的a标记时，这应该很容易）。然后你有了url，你可以下载给定日期的xls

内容类型不是您想要的。

请说明您迄今为止尝试了哪些内容？一个代码样本将不胜感激。