Python 如何使用Beauty Soup提取此HTML元素属性的值?

Python 如何使用Beauty Soup提取此HTML元素属性的值?,python,html,screen-scraping,beautifulsoup,web-scraping,Python,Html,Screen Scraping,Beautifulsoup,Web Scraping,我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示: <span class='class_id' id='New_line'></span> 如何获得class\u id?此答案指的是问题的旧版本,其中未提及beautifulsoup 您可以使用LXML并遍历所有元素,询问它们“class”属性的值。LXML是一个用于解析XML文档的库 例如: from lxml import etree root = etree.parse(

我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示:

<span class='class_id' id='New_line'></span>

如何获得
class\u id

此答案指的是问题的旧版本,其中未提及
beautifulsoup

您可以使用LXML并遍历所有元素,询问它们“class”属性的值。LXML是一个用于解析XML文档的库

例如:

from lxml import etree
root = etree.parse(filename).getroot()

for span in root.iterdescendants("span"):
    cls = span.attrib.get("class")

下面的例子对您有帮助吗

>>> from BeautifulSoup import BeautifulSoup as B
>>> s = B("<span class='class_id' id='New_line'></span>")
>>> s.span.attrs
[(u'class', u'class_id'), (u'id', u'New_line')]
>>从BeautifulSoup导入BeautifulSoup作为B
>>>s=B(“”)
>>>s.span.ATTR
[(u'class',u'class_id'),(u'id',u'New_line')]

我正在使用
beautifulsoup
库解析HTML。你认为我可以用它来获得class属性吗?也许你可以寻找“标签的属性”。