如何刮取包含字符串的属性（python、beautifulsoup）_Python_Beautifulsoup

如何刮取包含字符串的属性（python、beautifulsoup）

python

如何刮取包含字符串的属性（python、beautifulsoup）,python,beautifulsoup,Python,Beautifulsoup,我正在尝试清除所有包含^/album$的href标记。当我打印结果时，我得到一个空列表。我试过用re.compile和re.search查找和查找。除了一个空的列表之外，我什么也找不到代码：结果: [] 预期结果： /album... /album... /album... 您需要在Beauty Soup 4中使用href=而不是text=或string=来按href属性的内容进行过滤。后者即文本和字符串用于搜索标记中的字符串要查找包含/album的href属性的所有锚定标记，您需要执

我正在尝试清除所有包含^/album$的href标记。当我打印结果时，我得到一个空列表。我试过用re.compile和re.search查找和查找。除了一个空的列表之外，我什么也找不到

代码：

结果:

[]

预期结果：

/album...
/album...
/album...

您需要在Beauty Soup 4中使用href=而不是text=或string=来按href属性的内容进行过滤。后者即文本和字符串用于搜索标记中的字符串

要查找包含/album的href属性的所有锚定标记，您需要执行以下操作：

vk_albums = soup.find_all("a", href=re.compile("^/album"))
print(vk_albums)

然后，您可以在此列表中循环以仅打印href属性：

for album in vk_albums:
    print(album['href'])

结果是：[]好吧，我之所以得到一个空列表是因为^/album$。我以为我应该包括$。现在我得到了整个标签。更进一步。

for album in vk_albums:
    print(album['href'])