Python 如何使用Beauty Soup提取此HTML元素属性的值?
我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示:Python 如何使用Beauty Soup提取此HTML元素属性的值?,python,html,screen-scraping,beautifulsoup,web-scraping,Python,Html,Screen Scraping,Beautifulsoup,Web Scraping,我正在开发一个小工具来刮网页。我正在使用。我想从页面中获取类id。HTML代码如下所示: <span class='class_id' id='New_line'></span> 如何获得class\u id?此答案指的是问题的旧版本,其中未提及beautifulsoup 您可以使用LXML并遍历所有元素,询问它们“class”属性的值。LXML是一个用于解析XML文档的库 例如: from lxml import etree root = etree.parse(
<span class='class_id' id='New_line'></span>
如何获得class\u id
?此答案指的是问题的旧版本,其中未提及beautifulsoup
您可以使用LXML并遍历所有元素,询问它们“class”属性的值。LXML是一个用于解析XML文档的库
例如:
from lxml import etree
root = etree.parse(filename).getroot()
for span in root.iterdescendants("span"):
cls = span.attrib.get("class")
下面的例子对您有帮助吗
>>> from BeautifulSoup import BeautifulSoup as B
>>> s = B("<span class='class_id' id='New_line'></span>")
>>> s.span.attrs
[(u'class', u'class_id'), (u'id', u'New_line')]
>>从BeautifulSoup导入BeautifulSoup作为B
>>>s=B(“”)
>>>s.span.ATTR
[(u'class',u'class_id'),(u'id',u'New_line')]
我正在使用beautifulsoup
库解析HTML。你认为我可以用它来获得class属性吗?也许你可以寻找“标签的属性”。