Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ssis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用beautifulsoup刮取id值_Python_Beautifulsoup - Fatal编程技术网

Python 如何使用beautifulsoup刮取id值

Python 如何使用beautifulsoup刮取id值,python,beautifulsoup,Python,Beautifulsoup,我的问题是关于使用beautifulsoup刮取id值 首先,我这样做 html = driver.page_source soup = BeautifulSoup(html,'html parser') link = soup.find_all("li",{"id":re.compile("^goods")}) 然后呢, link.select_one('li[id^=goods]').get('id') 但它不起作用。链接没有任何功能 我必须做些什么来清除所有id值,名称是id=“go

我的问题是关于使用beautifulsoup刮取id值

首先,我这样做

html = driver.page_source
soup = BeautifulSoup(html,'html parser')

link = soup.find_all("li",{"id":re.compile("^goods")})
然后呢,

link.select_one('li[id^=goods]').get('id')
但它不起作用。链接没有任何功能

我必须做些什么来清除所有id值,名称是
id=“goods~”
??
请帮助我。

您需要进行层次结构扫描。但是,如果你只是想要所有与商品有关的文字,请使用这个

soup = BeautifulSoup(html_text)
for elem in soup(text=re.compile(r' #\S{12}')):
    print elem.parent 

请问{12}是什么意思?我想得到id值。例如,5530013 6066396 5529981。。。在图像文件中。我能找到一个方法来刮取那个号码吗??我知道的不多,因为我是第一次学习python。对不起@안홍경 您可以使用Chrome检查器获取xPath。请记住,如果要获取所有
  • 值,则必须读取父元素
      并获取所有嵌套的子元素,这样您就可以拥有更强大的操作元素并获取所需的所有值:)@안홍경 如果你要开始。我建议使用PyQuery,因为我自己使用它更简单。我不经常使用BS,因为它使数据收集变得太复杂。