Web scraping 刮取-查找所有子类的名称
我试图找到一种方法来获取根类中包含的子类的数量和它们的名称。 例如,作为对“o-container\uuuuu left u-mt-lg”类的回报:Web scraping 刮取-查找所有子类的名称,web-scraping,beautifulsoup,Web Scraping,Beautifulsoup,我试图找到一种方法来获取根类中包含的子类的数量和它们的名称。 例如,作为对“o-container\uuuuu left u-mt-lg”类的回报: class=“c-site\u容器” class=“c-site\u容器” class=“c-site\uuuu容器c-site\uuuu容器最后一个” 我和BeautifulSoup一起工作。我发现了这个,但它并没有达到我的预期: soup.div["class"] 谢谢你的帮助 从bs4导入美化组 from bs4 import Bea
- class=“c-site\u容器”
- class=“c-site\u容器”
- class=“c-site\uuuu容器c-site\uuuu容器最后一个”
soup.div["class"]
谢谢你的帮助 从bs4导入美化组
from bs4 import BeautifulSoup
data = """
<main class="o-page-content" role="main">
<section class="o-container">
<div class="o-container__left u-mt-lg">
<div class="c-site__container "></div>
<div class="c-site__container "></div>
<div class="c-site__container c-site__container__last"></div>
</div>
</div>
"""
soup = BeautifulSoup(data, 'html.parser')
for item in soup.findChild('div', attrs={'class': 'o-container__left u-mt-lg'}):
print(item)
data=”“”
"""
soup=BeautifulSoup(数据'html.parser')
对于soup.findChild('div',attrs={'class':'o-container\uuuu left u-mt-lg'})中的项:
打印(项目)
请下次将HTML
作为文本发布,而不是IMG
soup.findAll('div',attrs={'class':'value'}:并用class值替换value!对不起,我是通过电话在线的。请发布实际代码,而不是图片。