Python 使用BS4从具有特定属性的特定标记获取内容

Python 使用BS4从具有特定属性的特定标记获取内容,python,html,css,web-scraping,beautifulsoup,Python,Html,Css,Web Scraping,Beautifulsoup,我需要从以下带有这些属性的标记中获取内容:。 我将遇到的HTML示例是helloworld,它显然需要返回helloworld 我目前的代码如下: page=BeautifulSoup(文本'html.parser') 名称=[item[“class”]用于页面中的项目。查找所有('span')] 这样做很好,可以获得页面中的所有跨距,但我不知道如何指定我只需要具有特定类的跨距“h6 m-0”,并获取其中的内容。我该怎么做呢 page = BeautifulSoup(text, 'html.p

我需要从以下带有这些属性的标记中获取内容:
。 我将遇到的HTML示例是
helloworld
,它显然需要返回
helloworld

我目前的代码如下:

page=BeautifulSoup(文本'html.parser')
名称=[item[“class”]用于页面中的项目。查找所有('span')]
这样做很好,可以获得页面中的所有跨距,但我不知道如何指定我只需要具有特定类的跨距
“h6 m-0”
,并获取其中的内容。我该怎么做呢

page = BeautifulSoup(text, 'html.parser')
names = page.find_all('span' , class_ = 'h6 m-0')
在不了解您的用例的情况下,我不知道这是否有效

names = [item["class"] for item in page.find_all('span',class_="h6 m-0" )]
你能更具体地说明你面临的问题吗


但是这对你来说应该很好

这个答案与@bill发布的答案有什么不同?实际上,当bill也发布了一个答案时,我只是在回答这个问题。实际上,这很好,让我获得了我想要的所有跨度,但是我不能只获得标签中的文本。我可以使用正则表达式来提取它,但我觉得最好使用他们的方法。你会用什么来获得里面的文字呢?老实说,我自己也有点初学者,我只会玩弦乐。当然还有更好的方法。
打印([span.text代表页面中的span.select('span.h6.m-0'))