Python 在lxml.html中,如何获取节点的文本、子节点和子节点的内容?

Python 在lxml.html中,如何获取节点的文本、子节点和子节点的内容?,python,lxml,Python,Lxml,我正在使用python的lxml.html。我有一个xpath表达式,它获取节点的文本,但我需要的是所有文本,包括子标记的标记及其内容。如何实现这一点?元素的方法返回元素的文本,包括不带标记的子元素的文本内容。元素的方法返回元素的文本,包括不带标记的子元素的文本内容。我不确定您使用的是什么标记;因此,我编造了一些东西 你可以试试这样的东西: result = lxml.html.parse(url).xpath("//tr/td/a/text()") //tr表示从当前节点选择文档中与选择匹配

我正在使用python的lxml.html。我有一个xpath表达式,它获取节点的文本,但我需要的是所有文本,包括子标记的标记及其内容。如何实现这一点?

元素的方法返回元素的文本,包括不带标记的子元素的文本内容。

元素的方法返回元素的文本,包括不带标记的子元素的文本内容。

我不确定您使用的是什么标记;因此,我编造了一些东西

你可以试试这样的东西:

result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr表示从当前节点选择文档中与选择匹配的节点,无论它们位于何处


您可以使用此('/')表达式来绘制子标记的标记。

我不确定您使用的是什么标记;因此,我编造了一些东西

你可以试试这样的东西:

result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr表示从当前节点选择文档中与选择匹配的节点,无论它们位于何处


您可以使用这个(“/”)表达式来绘制子标记的标记。

您能解释一下您是否需要“元素中的所有文本”,或者更确切地说是“元素的源代码”吗?(或者其他什么?)您能解释一下您是否需要“元素中的所有文本”,或者更确切地说是“元素的源代码”吗?(还是别的什么?)