Python 3.x python beautifulsoup4提取specefic数据
大家好,我想提取一些类似这样的数据我正在使用python 3.6和BeautifulSoup4谢谢你们的帮助:Python 3.x python beautifulsoup4提取specefic数据,python-3.x,web-scraping,beautifulsoup,Python 3.x,Web Scraping,Beautifulsoup,大家好,我想提取一些类似这样的数据我正在使用python 3.6和BeautifulSoup4谢谢你们的帮助: from bs4 import BeautifulSoup source = html_data = """ <span class="some_data"> title 1 : data 1 <br/> title 2 : data 2 <b
from bs4 import BeautifulSoup
source = html_data = """
<span class="some_data">
title 1 : data 1
<br/>
title 2 : data 2
<br/>
title 3 : data 3
<br/>
<span class="meta_data">
other additional data
</span>
</span>
"""
soup = BeautifulSoup(source, 'lxml')
data = soup.find("span", class_="some_data").text
print(data)
# how to get only this : title 1 : data 1 / title 2 : data 2 / title 3 : data 3
# without : <span class="meta_data">
# other additional data
# </span>
从bs4导入美化组
source=html_data=“”
标题1:数据1
标题2:数据2
标题3:数据3
其他补充数据
"""
汤=BeautifulSoup(来源“lxml”)
data=soup.find(“span”,class=“some\u data”).text
打印(数据)
#如何仅获取以下内容:标题1:数据1/标题2:数据2/标题3:数据3
#没有:
#其他补充数据
#
谢谢,我已经解决了我的问题,以下是代码:
from lxml.html import fromstring
source = fromstring(source)
result = source.xpath("//span[@class='some_data']/text()")
for i in result :
print(i.strip())
酷。。。我想成为宇宙的主宰。那么你的问题是什么?你的代码在哪里?@Andersson很好,我已经把代码放好了。我不确定你能用BeautifulSoup获得所需的输出,但你可以用XPath和XPath获得它。
//span[@class=“some_data”]/text()