Python 用lxml.html替换元素_Python_Lxml

Python 用lxml.html替换元素

python

Python 用lxml.html替换元素,python,lxml,Python,Lxml,作为一个整体，我对lxml和HTML解析器相当陌生。我想知道是否有办法用另一个元素替换树中的一个元素例如，我有： body = """<code> def function(arg): print arg </code> Blah blah blah <code> int main() { return 0; } </code> """ doc = lxml.html.fromstring(body) codeblocks = doc.css

作为一个整体，我对lxml和HTML解析器相当陌生。我想知道是否有办法用另一个元素替换树中的一个元素

例如，我有：

body = """<code> def function(arg): print arg </code> Blah blah blah <code> int main() { return 0; } </code> """

doc = lxml.html.fromstring(body)
codeblocks = doc.cssselect('code')

for block in codeblocks:
  lexer = guess_lexer(block.text_content())
  hilited = highlight(block.text_content(), lexer, HtmlFormatter())
  doc.replace(block, hilited)

我想按照这些思路做一些事情，但这会导致“TypeError”，因为“hilited”不是lxml.etree.\u元素

这是否可行

关于，

如果您是python HTML解析器的新手，您可以尝试一下，一个HTML/xml解析器，它可以让您使用。

关于lxml

在

doc.replace（块，hilited）

block是lxml的元素对象，hilited是字符串，不能替换它

有两种方法可以做到这一点

block.text=hilited

或

我一直在四处搜索，我注意到BeautifulSoup通过replaceWith具有这种确切的功能，在lxml中是否有类似的功能？（如果不是的话，那没关系，不过我还是很感兴趣）再次感谢！啊，我明白了！这是有道理的。谢谢我刚刚看过BeautifulSoup，它似乎比lxml.html更适合我的使用。谢谢你的建议！

body=body.replace(block.text,hilited)