Python 使用lxml.etree读取元素中的文本_Python_Lxml_Elementtree

Python 使用lxml.etree读取元素中的文本

python

Python 使用lxml.etree读取元素中的文本,python,lxml,elementtree,Python,Lxml,Elementtree,我正在使用lxml库的Python版本。我目前正试图解析表中的文本，但遇到了一个问题，其中一些文本是链接例如，其中一个单元格可能看起来像这样： <td> Can I kick it, <a>to all the people</a> who can quest like a <a>tribe</a> does </td> 我能把它踢给所有能像部落一样追求的人吗假设在解析html之后，td元素存储为foo。然

我正在使用lxml库的Python版本。我目前正试图解析表中的文本，但遇到了一个问题，其中一些文本是链接

例如，其中一个单元格可能看起来像这样：

<td>
    Can I kick it, <a>to all the people</a> who can quest like a <a>tribe</a> does
</td>


我能把它踢给所有能像部落一样追求的人吗

假设在解析html之后，td元素存储为

foo

。然后

foo.text

将不显示整个文本，只显示非链接的部分。此外，如果我使用

[I.text for I in foo.getchildren（）]

找到链接文本，我就不再知道放置非链接文本和链接文本的顺序

有没有一个简单的方法来解决这个问题？

在搜索了一个小时后，在发布这个问题的2分钟内，我找到了解决方案

使用方法

foo.text\u content（）

将显示所需内容