Python 如何使用Beauty Soup提取此HTML元素属性的值？_Python_Html_Screen Scraping_Beautifulsoup_Web Scraping

Python 如何使用Beauty Soup提取此HTML元素属性的值？

python html web-scraping

Python 如何使用Beauty Soup提取此HTML元素属性的值？,python,html,screen-scraping,beautifulsoup,web-scraping,Python,Html,Screen Scraping,Beautifulsoup,Web Scraping,我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示： <span class='class_id' id='New_line'></span> 如何获得class\u id？此答案指的是问题的旧版本，其中未提及beautifulsoup 您可以使用LXML并遍历所有元素，询问它们“class”属性的值。LXML是一个用于解析XML文档的库例如： from lxml import etree root = etree.parse(

我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示：

<span class='class_id' id='New_line'></span>

如何获得

class\u id

？

此答案指的是问题的旧版本，其中未提及

beautifulsoup

您可以使用LXML并遍历所有元素，询问它们“class”属性的值。LXML是一个用于解析XML文档的库

例如：

from lxml import etree
root = etree.parse(filename).getroot()

for span in root.iterdescendants("span"):
    cls = span.attrib.get("class")

下面的例子对您有帮助吗

>>> from BeautifulSoup import BeautifulSoup as B
>>> s = B("<span class='class_id' id='New_line'></span>")
>>> s.span.attrs
[(u'class', u'class_id'), (u'id', u'New_line')]

>>从BeautifulSoup导入BeautifulSoup作为B
>>>s=B（“”）
>>>s.span.ATTR
[（u'class'，u'class_id'），（u'id'，u'New_line'）]

我正在使用

beautifulsoup

库解析HTML。你认为我可以用它来获得class属性吗？也许你可以寻找“标签的属性”。