如何刮取包含字符串的属性(python、beautifulsoup)

如何刮取包含字符串的属性(python、beautifulsoup),python,beautifulsoup,Python,Beautifulsoup,我正在尝试清除所有包含^/album$的href标记。当我打印结果时,我得到一个空列表。我试过用re.compile和re.search查找和查找。除了一个空的列表之外,我什么也找不到 代码: 结果: [] 预期结果: /album... /album... /album... 您需要在Beauty Soup 4中使用href=而不是text=或string=来按href属性的内容进行过滤。后者即文本和字符串用于搜索标记中的字符串 要查找包含/album的href属性的所有锚定标记,您需要执

我正在尝试清除所有包含^/album$的href标记。当我打印结果时,我得到一个空列表。我试过用re.compile和re.search查找和查找。除了一个空的列表之外,我什么也找不到

代码:

结果:

[]
预期结果:

/album...
/album...
/album...
您需要在Beauty Soup 4中使用href=而不是text=或string=来按href属性的内容进行过滤。后者即文本和字符串用于搜索标记中的字符串

要查找包含/album的href属性的所有锚定标记,您需要执行以下操作:

vk_albums = soup.find_all("a", href=re.compile("^/album"))
print(vk_albums) 
然后,您可以在此列表中循环以仅打印href属性:

for album in vk_albums:
    print(album['href'])

结果是:[]好吧,我之所以得到一个空列表是因为^/album$。我以为我应该包括$。现在我得到了整个标签。更进一步。
for album in vk_albums:
    print(album['href'])