在python中使用BeautifulSoup提取id以特定字符串开头的元素_Python_Beautifulsoup

在python中使用BeautifulSoup提取id以特定字符串开头的元素

python

在python中使用BeautifulSoup提取id以特定字符串开头的元素,python,beautifulsoup,Python,Beautifulsoup,我正在尝试用BS4做一些网页抓取到目前为止，我已经提取了我尝试了item.id，但不起作用我缺少什么？将re模块与id一起使用以下是方法：从bs4导入美化组进口稀土如果名称=“\uuuuu main\uuuuuuuu”： html=“” soup=BeautifulSoup（html，'html.parser'）打印（soup.find（'a'，id=re.compile（'^entry'））输出： <a href="http://www.sampleurl.com/

我正在尝试用BS4做一些网页抓取

到目前为止，我已经提取了

我尝试了

item.id

，但不起作用

我缺少什么？

将

re

模块与

id

一起使用
以下是方法：

从bs4导入美化组
进口稀土
如果名称=“\uuuuu main\uuuuuuuu”：
html=“”
soup=BeautifulSoup（html，'html.parser'）
打印（soup.find（'a'，id=re.compile（'^entry'））

输出：

<a href="http://www.sampleurl.com/static/welcome" id="entry_1">Lamborghini </a>

item.get（'id'）

？是的，如果条件是“id以'entry'开头”

url=[汤中的项目。如果item.get（'id'，”）[:6]==“entry_”]]

现在你有两个问题，但我认为一次性解决方案是可以的。此外，这也是选择节点的官方/推荐方式

<a href="http://www.sampleurl.com/static/welcome" id="entry_1">Lamborghini </a>

<a href="http://www.sampleurl.com/static/welcome" id="entry_1">Lamborghini </a>