如何刮；下载页「；任何使用python的站点的_Python_Web Scraping_Beautifulsoup

如何刮；下载页「；任何使用python的站点的

python web-scraping

如何刮；下载页「；任何使用python的站点的,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我想用python从任何网站的下载页面中提取有关版本及其下载链接的信息。我正在学习python，并希望使用beautifulsoup来实现它，但是这些页面非常复杂，而且看起来很难找到这些东西。提前感谢欢迎来到Stack Overflow--我猜你的意思是“刮”，因为“刮”的意思是“扔掉” 首先，您必须使用urllib2为要刮取的页面创建文件对象。阅读以了解如何进行然后，您必须通过检查页面的html内容来确定希望从页面本身获取哪些信息最后，将file对象传递给beautiful soup的

我想用python从任何网站的下载页面中提取有关版本及其下载链接的信息。我正在学习python，并希望使用beautifulsoup来实现它，但是这些页面非常复杂，而且看起来很难找到这些东西。

提前感谢

欢迎来到Stack Overflow--我猜你的意思是“刮”，因为“刮”的意思是“扔掉”

首先，您必须使用urllib2为要刮取的页面创建文件对象。阅读以了解如何进行

然后，您必须通过检查页面的html内容来确定希望从页面本身获取哪些信息

最后，将file对象传递给beautiful soup的解析器，并导航HTML以返回要获取的信息

为了将来参考，BeautifulSoup提供了漂亮的文档。如果你想擅长编程，你必须学会如何阅读文档——从这里开始，这真的会变得更难。

你的问题太模糊了，没有人敢回答：）仅供参考，它是刮（刮，刮，刮，刮）而不是刮，除非完全必要，我倾向于避免

urllib2

而支持@JonClements我也这么做，但是如果有人说他们是初学者，我通常会根据标准库给出建议。请求的期限是几个月（或几周，或几年，取决于学生的专注程度）。