Python 如何使用beautifulsoup刮取id值
我的问题是关于使用beautifulsoup刮取id值 首先,我这样做Python 如何使用beautifulsoup刮取id值,python,beautifulsoup,Python,Beautifulsoup,我的问题是关于使用beautifulsoup刮取id值 首先,我这样做 html = driver.page_source soup = BeautifulSoup(html,'html parser') link = soup.find_all("li",{"id":re.compile("^goods")}) 然后呢, link.select_one('li[id^=goods]').get('id') 但它不起作用。链接没有任何功能 我必须做些什么来清除所有id值,名称是id=“go
html = driver.page_source
soup = BeautifulSoup(html,'html parser')
link = soup.find_all("li",{"id":re.compile("^goods")})
然后呢,
link.select_one('li[id^=goods]').get('id')
但它不起作用。链接没有任何功能
我必须做些什么来清除所有id值,名称是id=“goods~”
??
请帮助我。您需要进行层次结构扫描。但是,如果你只是想要所有与商品有关的文字,请使用这个
soup = BeautifulSoup(html_text)
for elem in soup(text=re.compile(r' #\S{12}')):
print elem.parent
请问{12}是什么意思?我想得到id值。例如,5530013 6066396 5529981。。。在图像文件中。我能找到一个方法来刮取那个号码吗??我知道的不多,因为我是第一次学习python。对不起@안홍경 您可以使用Chrome检查器获取xPath。请记住,如果要获取所有
- 并获取所有嵌套的子元素,这样您就可以拥有更强大的操作元素并获取所需的所有值:)@안홍경 如果你要开始。我建议使用PyQuery,因为我自己使用它更简单。我不经常使用BS,因为它使数据收集变得太复杂。