Python 如何使用beautifulsoup刮取id值_Python_Beautifulsoup

Python 如何使用beautifulsoup刮取id值

python

Python 如何使用beautifulsoup刮取id值,python,beautifulsoup,Python,Beautifulsoup,我的问题是关于使用beautifulsoup刮取id值首先，我这样做 html = driver.page_source soup = BeautifulSoup(html,'html parser') link = soup.find_all("li",{"id":re.compile("^goods")}) 然后呢, link.select_one('li[id^=goods]').get('id') 但它不起作用。链接没有任何功能我必须做些什么来清除所有id值，名称是id=“go

我的问题是关于使用beautifulsoup刮取id值

首先，我这样做

html = driver.page_source
soup = BeautifulSoup(html,'html parser')

link = soup.find_all("li",{"id":re.compile("^goods")})

然后呢,

link.select_one('li[id^=goods]').get('id')

但它不起作用。链接没有任何功能

我必须做些什么来清除所有id值，名称是

id=“goods~”

？？

请帮助我。

您需要进行层次结构扫描。但是，如果你只是想要所有与商品有关的文字，请使用这个

soup = BeautifulSoup(html_text)
for elem in soup(text=re.compile(r' #\S{12}')):
    print elem.parent

请问{12}是什么意思？我想得到id值。例如，5530013 6066396 5529981。。。在图像文件中。我能找到一个方法来刮取那个号码吗？？我知道的不多，因为我是第一次学习python。对不起@안홍경 您可以使用Chrome检查器获取xPath。请记住，如果要获取所有

值，则必须读取父元素

并获取所有嵌套的子元素，这样您就可以拥有更强大的操作元素并获取所需的所有值：）@안홍경 如果你要开始。我建议使用PyQuery，因为我自己使用它更简单。我不经常使用BS，因为它使数据收集变得太复杂。