Python BeautifulSoup在字符后拆分文本

Python BeautifulSoup在字符后拆分文本,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我得到了BeautifulSoup返回的以下代码: <ul class="list-unstyled"> <li> <span class="item"> <span class="text-bold"> Company: </span> Company Name </span> </li> <li> <span class="item">

我得到了BeautifulSoup返回的以下代码:

<ul class="list-unstyled">
<li>
  <span class="item">
    <span class="text-bold">
      Company:
    </span>
    Company Name
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Location:
    </span>
    Berlin
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Country:
    </span>
    Germany
  </span>
</li>
  • 公司: 公司名称
  • 地点: 柏林
  • 国家: 德国

现在我想提取HTML以输出以下信息:公司名称、柏林和德国


如何实现这一点?

您可以通过使用属性来访问它们。查看下面的解决方案

from bs4 import BeautifulSoup

content = """
<ul class="list-unstyled">
<li>
  <span class="item">
    <span class="text-bold">
      Company:
    </span>
    Company Name
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Location:
    </span>
    Berlin
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Country:
    </span>
    Germany
  </span>
</li>
"""

soup = BeautifulSoup(content,"lxml")
for items in soup.select(".text-bold"):
  print(items.next_sibling.strip())
我认为要实现这一点,您应该编写一些代码:)您尝试过这个解决方案吗?让我们看看你是怎么尝试的
Company Name
Berlin
Germany