如何提取<;之间的href链接;h1></h1>;用Python?

如何提取<;之间的href链接;h1></h1>;用Python?,python,Python,我是Python新手,我正在尝试学习网络抓取 我有以下代码,想知道如何获取/打印href或链接: 有机密消息吗 您可以使用beautifulsou完成此项工作: from urllib.request import urlopen from bs4 import BeautifulSoup import re response = urlopen("http://someurl.com") page_source = response.read() soup = BeautifulSoup(p

我是Python新手,我正在尝试学习网络抓取

我有以下代码,想知道如何获取/打印href或链接:


有机密消息吗

您可以使用
beautifulsou
完成此项工作:

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re

response = urlopen("http://someurl.com")
page_source = response.read()
soup = BeautifulSoup(page_source, 'html.parser')
x = soup.find_all('h1')
print (x)
然后,您所要做的就是使用
re
模块从输出中提取数据。

类似于另一个类似的模块