Python 在lxml.html中,如何获取节点的文本、子节点和子节点的内容?
我正在使用python的lxml.html。我有一个xpath表达式,它获取节点的文本,但我需要的是所有文本,包括子标记的标记及其内容。如何实现这一点?元素的方法返回元素的文本,包括不带标记的子元素的文本内容。元素的方法返回元素的文本,包括不带标记的子元素的文本内容。我不确定您使用的是什么标记;因此,我编造了一些东西 你可以试试这样的东西:Python 在lxml.html中,如何获取节点的文本、子节点和子节点的内容?,python,lxml,Python,Lxml,我正在使用python的lxml.html。我有一个xpath表达式,它获取节点的文本,但我需要的是所有文本,包括子标记的标记及其内容。如何实现这一点?元素的方法返回元素的文本,包括不带标记的子元素的文本内容。元素的方法返回元素的文本,包括不带标记的子元素的文本内容。我不确定您使用的是什么标记;因此,我编造了一些东西 你可以试试这样的东西: result = lxml.html.parse(url).xpath("//tr/td/a/text()") //tr表示从当前节点选择文档中与选择匹配
result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr表示从当前节点选择文档中与选择匹配的节点,无论它们位于何处
您可以使用此('/')表达式来绘制子标记的标记。我不确定您使用的是什么标记;因此,我编造了一些东西 你可以试试这样的东西:
result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr表示从当前节点选择文档中与选择匹配的节点,无论它们位于何处
您可以使用这个(“/”)表达式来绘制子标记的标记。您能解释一下您是否需要“元素中的所有文本”,或者更确切地说是“元素的源代码”吗?(或者其他什么?)您能解释一下您是否需要“元素中的所有文本”,或者更确切地说是“元素的源代码”吗?(还是别的什么?)