Python BeautifulSoup提取不带div的div文本_Python_Html_Beautifulsoup

Python BeautifulSoup提取不带div的div文本

python html

Python BeautifulSoup提取不带div的div文本,python,html,beautifulsoup,Python,Html,Beautifulsoup,我从一个包含div（没有）的div中提取文本有点困难。这就是： <div style="width:100%"> <div class="status_p"> ACTIVE </div> Name </div> 活跃的名称我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时，它总是给我ACTIVEName您可以在bs4标记上使用children属性，

我从一个包含div（没有）的div中提取文本有点困难。这就是：

<div style="width:100%">
    <div class="status_p">
    ACTIVE
    </div>
   Name
</div>


活跃的
名称

我想在没有div的情况下提取具有活动属性的名称。每当我打印第一个div时，它总是给我ACTIVEName

您可以在bs4标记上使用

children

属性，该属性提供标记中的所有子项。选择子项后，可以获取子项列表的最后一个元素

from bs4 import BeautifulSoup

html = """<div style="width:100%">
    <div class="status_p">
    ACTIVE
    </div>
   Name
</div>"""

soup = BeautifulSoup(html, "html.parser")

print(list(soup.find("div").children)[-1].strip())

或

您可以使用

stripped\u字符串

print(list(soup.find("div").stripped_strings)[-1])

或

您可以删除内部div并仅获取名称

soup.find("div",class_="status_p").extract()
print(soup.find("div").get_text(strip=True))

我已经找到了解决方案并使用了

find("div", class_="status_p").decompose()

每次尝试使用.children或.u字符串时都会出错

find("div", class_="status_p").decompose()