Beautifulsoup 漂亮的汤解析具有不一致HREF的标记_Beautifulsoup

Beautifulsoup 漂亮的汤解析具有不一致HREF的标记

Beautifulsoup 漂亮的汤解析具有不一致HREF的标记,beautifulsoup,Beautifulsoup,我知道可以提取html页面中的所有a标记： mydivs = soup.findAll("a") 但是，如果我只想要具有这种格式的标记，该怎么办 <a href="/experiments/ENCSR7EADCH/"> <a href="/experiments/ENCSR77RTSA/"> <a href="/experiments/ENCSR75YUDJ/"> <a href="/experiments/ENCSR779CZG/"> 但

我知道可以提取html页面中的所有a标记：

  mydivs = soup.findAll("a")

但是，如果我只想要具有这种格式的标记，该怎么办

<a href="/experiments/ENCSR7EADCH/">
<a href="/experiments/ENCSR77RTSA/">
<a href="/experiments/ENCSR75YUDJ/">
<a href="/experiments/ENCSR779CZG/">

但这将返回一个空列表

有什么建议吗？

mydivs = soup.findAll("a", { "href" : "/experiments/ENCSR*" })

import re
mydivs = soup.findAll("a", href=re.compile(r"/experiments/ENCSR"))

mydivs = soup.select('a[href^="/experiments/ENCSR"]')