Python 使用BeautifulsSoup从跨度中隔离跨度标题

Python 使用BeautifulsSoup从跨度中隔离跨度标题,python,beautifulsoup,Python,Beautifulsoup,我有以下几点 <h3>The price of something is <span title="60,487">60.5k</span></h3> 某物的价格是60.5k 我想从span中获得标题。这是如何实现的?此跨距标题是动态的,可从网站更改。您可以使用 >>从bs4导入BeautifulSoup作为BS >>>html=“”某物的价格是60.5k”“” >>>soup=BS(html,“html.parser”) >>>汤。选择一个(

我有以下几点

<h3>The price of something is <span title="60,487">60.5k</span></h3>
某物的价格是60.5k
我想从span中获得标题。这是如何实现的?此跨距标题是动态的,可从网站更改。

您可以使用

>>从bs4导入BeautifulSoup作为BS
>>>html=“”某物的价格是60.5k”“”
>>>soup=BS(html,“html.parser”)
>>>汤。选择一个(“h3>span[title]”。获取(“title”)
'60,487'

span
与您文档中的其他
span
有何不同?这是唯一一个带有
title
属性的span吗?在整个网站上,不是。到目前为止,我已经隔离了上面的代码,所以在我正在使用的是唯一的标题标签。但在这种情况下,我想要的是60487,我不清楚。是什么让这个标签特别?是因为它位于
h3
内部,并且有一个
title
属性吗?在整个网站上只有一个h3标记,因此是的,它是特殊的
>>> from bs4 import BeautifulSoup as BS
>>> html = """<h3>The price of something is <span title="60,487">60.5k</span></h3>"""
>>> soup = BS(html, "html.parser")
>>> soup.select_one("h3 > span[title]").get("title")
'60,487'