Python BeautifulSoup在字符后拆分文本
我得到了BeautifulSoup返回的以下代码:Python BeautifulSoup在字符后拆分文本,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我得到了BeautifulSoup返回的以下代码: <ul class="list-unstyled"> <li> <span class="item"> <span class="text-bold"> Company: </span> Company Name </span> </li> <li> <span class="item">
<ul class="list-unstyled">
<li>
<span class="item">
<span class="text-bold">
Company:
</span>
Company Name
</span>
</li>
<li>
<span class="item">
<span class="text-bold">
Location:
</span>
Berlin
</span>
</li>
<li>
<span class="item">
<span class="text-bold">
Country:
</span>
Germany
</span>
</li>
-
公司:
公司名称
-
地点:
柏林
-
国家:
德国
现在我想提取HTML以输出以下信息:公司名称、柏林和德国
如何实现这一点?您可以通过使用属性来访问它们。查看下面的解决方案
from bs4 import BeautifulSoup
content = """
<ul class="list-unstyled">
<li>
<span class="item">
<span class="text-bold">
Company:
</span>
Company Name
</span>
</li>
<li>
<span class="item">
<span class="text-bold">
Location:
</span>
Berlin
</span>
</li>
<li>
<span class="item">
<span class="text-bold">
Country:
</span>
Germany
</span>
</li>
"""
soup = BeautifulSoup(content,"lxml")
for items in soup.select(".text-bold"):
print(items.next_sibling.strip())
我认为要实现这一点,您应该编写一些代码:)您尝试过这个解决方案吗?让我们看看你是怎么尝试的
Company Name
Berlin
Germany