Python BeautifulSoup提取不带div的div文本

Python BeautifulSoup提取不带div的div文本,python,html,beautifulsoup,Python,Html,Beautifulsoup,我从一个包含div(没有)的div中提取文本有点困难。这就是: <div style="width:100%"> <div class="status_p"> ACTIVE </div> Name </div> 活跃的 名称 我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时,它总是给我ACTIVEName您可以在bs4标记上使用children属性,

我从一个包含div(没有)的div中提取文本有点困难。这就是:

<div style="width:100%">
    <div class="status_p">
    ACTIVE
    </div>
   Name
</div>

活跃的
名称

我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时,它总是给我ACTIVEName

您可以在bs4标记上使用
children
属性,该属性提供标记中的所有子项。选择子项后,可以获取子项列表的最后一个元素

from bs4 import BeautifulSoup

html = """<div style="width:100%">
    <div class="status_p">
    ACTIVE
    </div>
   Name
</div>"""

soup = BeautifulSoup(html, "html.parser")

print(list(soup.find("div").children)[-1].strip())

您可以使用
stripped\u字符串

print(list(soup.find("div").stripped_strings)[-1])

您可以删除内部div并仅获取名称

soup.find("div",class_="status_p").extract()
print(soup.find("div").get_text(strip=True))

我已经找到了解决方案并使用了

find("div", class_="status_p").decompose()

每次尝试使用.children或.u字符串时都会出错
find("div", class_="status_p").decompose()