Python BeautifulSoup提取不带div的div文本
我从一个包含div(没有)的div中提取文本有点困难。这就是:Python BeautifulSoup提取不带div的div文本,python,html,beautifulsoup,Python,Html,Beautifulsoup,我从一个包含div(没有)的div中提取文本有点困难。这就是: <div style="width:100%"> <div class="status_p"> ACTIVE </div> Name </div> 活跃的 名称 我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时,它总是给我ACTIVEName您可以在bs4标记上使用children属性,
<div style="width:100%">
<div class="status_p">
ACTIVE
</div>
Name
</div>
活跃的
名称
我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时,它总是给我ACTIVEName您可以在bs4标记上使用
children
属性,该属性提供标记中的所有子项。选择子项后,可以获取子项列表的最后一个元素
from bs4 import BeautifulSoup
html = """<div style="width:100%">
<div class="status_p">
ACTIVE
</div>
Name
</div>"""
soup = BeautifulSoup(html, "html.parser")
print(list(soup.find("div").children)[-1].strip())
或
您可以使用stripped\u字符串
print(list(soup.find("div").stripped_strings)[-1])
或
您可以删除内部div并仅获取名称
soup.find("div",class_="status_p").extract()
print(soup.find("div").get_text(strip=True))
我已经找到了解决方案并使用了
find("div", class_="status_p").decompose()
每次尝试使用.children或.u字符串时都会出错
find("div", class_="status_p").decompose()