如何刮;下载页「;任何使用python的站点的

如何刮;下载页「;任何使用python的站点的,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我想用python从任何网站的下载页面中提取有关版本及其下载链接的信息。 我正在学习python,并希望使用beautifulsoup来实现它,但是这些页面非常复杂,而且看起来很难找到这些东西。 提前感谢欢迎来到Stack Overflow--我猜你的意思是“刮”,因为“刮”的意思是“扔掉” 首先,您必须使用urllib2为要刮取的页面创建文件对象。阅读以了解如何进行 然后,您必须通过检查页面的html内容来确定希望从页面本身获取哪些信息 最后,将file对象传递给beautiful soup的

我想用python从任何网站的下载页面中提取有关版本及其下载链接的信息。 我正在学习python,并希望使用beautifulsoup来实现它,但是这些页面非常复杂,而且看起来很难找到这些东西。
提前感谢

欢迎来到Stack Overflow--我猜你的意思是“刮”,因为“刮”的意思是“扔掉”

首先,您必须使用urllib2为要刮取的页面创建文件对象。阅读以了解如何进行

然后,您必须通过检查页面的html内容来确定希望从页面本身获取哪些信息

最后,将file对象传递给beautiful soup的解析器,并导航HTML以返回要获取的信息


为了将来参考,BeautifulSoup提供了漂亮的文档。如果你想擅长编程,你必须学会如何阅读文档——从这里开始,这真的会变得更难。

你的问题太模糊了,没有人敢回答:)仅供参考,它是刮(刮,刮,刮,刮)而不是刮,除非完全必要,我倾向于避免
urllib2
而支持@JonClements我也这么做,但是如果有人说他们是初学者,我通常会根据标准库给出建议。请求的期限是几个月(或几周,或几年,取决于学生的专注程度)。