Python 使用BS4从具有特定属性的特定标记获取内容_Python_Html_Css_Web Scraping_Beautifulsoup

Python 使用BS4从具有特定属性的特定标记获取内容

python html css web-scraping

Python 使用BS4从具有特定属性的特定标记获取内容,python,html,css,web-scraping,beautifulsoup,Python,Html,Css,Web Scraping,Beautifulsoup,我需要从以下带有这些属性的标记中获取内容：。我将遇到的HTML示例是helloworld，它显然需要返回helloworld 我目前的代码如下： page=BeautifulSoup（文本'html.parser'）名称=[item[“class”]用于页面中的项目。查找所有（'span'）] 这样做很好，可以获得页面中的所有跨距，但我不知道如何指定我只需要具有特定类的跨距“h6 m-0”，并获取其中的内容。我该怎么做呢 page = BeautifulSoup(text, 'html.p

我需要从以下带有这些属性的标记中获取内容：

。我将遇到的HTML示例是

helloworld

，它显然需要返回

helloworld

我目前的代码如下：

page=BeautifulSoup（文本'html.parser'）
名称=[item[“class”]用于页面中的项目。查找所有（'span'）]

这样做很好，可以获得页面中的所有跨距，但我不知道如何指定我只需要具有特定类的跨距

“h6 m-0”

，并获取其中的内容。我该怎么做呢

page = BeautifulSoup(text, 'html.parser')
names = page.find_all('span' , class_ = 'h6 m-0')

在不了解您的用例的情况下，我不知道这是否有效

names = [item["class"] for item in page.find_all('span',class_="h6 m-0" )]

你能更具体地说明你面临的问题吗

但是这对你来说应该很好

这个答案与@bill发布的答案有什么不同？实际上，当bill也发布了一个答案时，我只是在回答这个问题。实际上，这很好，让我获得了我想要的所有跨度，但是我不能只获得标签中的文本。我可以使用正则表达式来提取它，但我觉得最好使用他们的方法。你会用什么来获得里面的文字呢？老实说，我自己也有点初学者，我只会玩弦乐。当然还有更好的方法。

打印（[span.text代表页面中的span.select（'span.h6.m-0'））

？