Python BeautifulSoup在字符后拆分文本_Python_Web Scraping_Beautifulsoup

Python BeautifulSoup在字符后拆分文本

python web-scraping

Python BeautifulSoup在字符后拆分文本,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我得到了BeautifulSoup返回的以下代码： <ul class="list-unstyled"> <li> Company: Company Name </li> <li>

我得到了BeautifulSoup返回的以下代码：

<ul class="list-unstyled">
<li>
  <span class="item">
    <span class="text-bold">
      Company:
    </span>
    Company Name
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Location:
    </span>
    Berlin
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Country:
    </span>
    Germany
  </span>
</li>



公司：
公司名称


地点：
柏林


国家：
德国

现在我想提取HTML以输出以下信息：公司名称、柏林和德国

如何实现这一点？

您可以通过使用属性来访问它们。查看下面的解决方案

from bs4 import BeautifulSoup

content = """
<ul class="list-unstyled">
<li>
  <span class="item">
    <span class="text-bold">
      Company:
    </span>
    Company Name
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Location:
    </span>
    Berlin
  </span>
</li>
<li>
  <span class="item">
    <span class="text-bold">
      Country:
    </span>
    Germany
  </span>
</li>
"""

soup = BeautifulSoup(content,"lxml")
for items in soup.select(".text-bold"):
  print(items.next_sibling.strip())

我认为要实现这一点，您应该编写一些代码：）您尝试过这个解决方案吗？让我们看看你是怎么尝试的

Company Name
Berlin
Germany