Python 靓汤-如何获得<;李>;来自div类和<;ul>;没有ul的任何类名,也没有ID
输入数据如下所示,其中有多个Python 靓汤-如何获得<;李>;来自div类和<;ul>;没有ul的任何类名,也没有ID,python,html,beautifulsoup,Python,Html,Beautifulsoup,输入数据如下所示,其中有多个ul标记,可以在python beautiful soup中进行刮取 商用汽车超额责任一般责任内陆海运(货物)专业责任财产工人赔偿
ul
标记,可以在python beautiful soup中进行刮取
商用汽车- 超额责任
一般责任- 内陆海运(货物)
专业责任财产- 工人赔偿
假设
娱乐\u soup
包含您提到的HTML,这应该可以:
from bs4 import BeautifulSoup
page = '<div class="column one-second"><p></p> <ul> <li>Commercial automobile</li> <li>Excess liability</li> <li>General liability</li> <li>Inland marine (cargo)</li> </ul> <p></p></div> <div class="column one-second"><p></p> <ul> <li>Professional Liability</li> <li>Property</li> <li>Workers’ compensation</li> </ul> <p></p></div>'
amusements_soup = BeautifulSoup(page,"html.parser")
for item in amusements_soup.findAll('div',{'class':'column one-second'}):
sub_items = item.findAll('li')
for sub_item in sub_items:
print(sub_item.text)
如果这对您不起作用,您必须检查娱乐汤
是否确实是您所认为的使用列表理解的带有后代组合器的类和类型选择器也是一样的
results = [item.text for item in amusements_soup.select('.one-second li')]
使用lis=soup.find_all('li');uls=soup.find_all('ul')
?但我只需要特定类别的li项目,如下所示:- 商用汽车
- 超额责任
- 一般责任
- 内陆海运(货物) 如果您只需要特定类别的
li
项目,那么为什么您不想使用任何类
或ID
属性呢?这就是他们的目的。。只查找那些项目。没有可用的ID属性!!那么您从哪里获得类
属性?我也没有看到任何class
属性,但您正在使用它
Commercial automobile
Excess liability
General liability
Inland marine (cargo)
Professional Liability
Property
Workers’ compensation
results = [item.text for item in amusements_soup.select('.one-second li')]