Python 什么';这是';美丽集团';和';lxml';?
在Python 什么';这是';美丽集团';和';lxml';?,python,beautifulsoup,html-parsing,lxml,Python,Beautifulsoup,Html Parsing,Lxml,在lxml中,它表示: lxml可以通过lxml.html.soupparser模块与BeautifulSoup的解析功能接口。它提供了三个主要函数:fromstring()和parse(),用于使用BeautifulSoup将字符串或文件解析为lxml.html文档;convert_tree()用于将现有BeautifulSoup树转换为顶级元素列表 同时,BS”也可以使用lxml作为解析器 Beauty Soup支持Python标准库中包含的HTML解析器,但也支持许多第三方Python解析
lxml
中,它表示:
lxml可以通过lxml.html.soupparser模块与BeautifulSoup的解析功能接口。它提供了三个主要函数:fromstring()和parse(),用于使用BeautifulSoup将字符串或文件解析为lxml.html文档;convert_tree()用于将现有BeautifulSoup树转换为顶级元素列表
同时,BS
”也可以使用lxml
作为解析器
Beauty Soup支持Python标准库中包含的HTML解析器,但也支持许多第三方Python解析器。一个是lxml解析器
BS
也建议使用lxml
作为速度分析器
那么,如果lxml
使用BS
进行解析,而BS
的解析器反过来是lxml
呢
我一直在为理解他们的关系而挠头。帮助。关于
BS
解析器和lxml.html
解析器,不应该有任何混淆BS
有一个HTML解析器,lxml
有自己的HTML解析器
您引用的BS
文档只是说,您可以使用lxml
解析器或其他可能的第三方解析器将HTML解析为BS
汤对象,以替代使用默认的BS
解析器:
BeautifulSoup(markup, "lxml")
root = lxml.html.soupparser.fromstring(tag_soup)
类似地,lxml
文档说明,您可以使用BS
解析器将HTML解析为lxml
树对象,以替代使用默认的lxml.HTML
解析器:
BeautifulSoup(markup, "lxml")
root = lxml.html.soupparser.fromstring(tag_soup)
我把你的问题投了赞成票,因为我认为这是一个好问题。然后我注意到上面列出的相关问题,并点击了链接。我认为当时的答案非常好,有助于澄清这两个库的功能之间的关系。