pythonlxml：如何从具有子元素的元素中获取文本_Python_Lxml

pythonlxml：如何从具有子元素的元素中获取文本

python

pythonlxml：如何从具有子元素的元素中获取文本,python,lxml,Python,Lxml,我想从html代码中提取一些文本，但是下面的代码不支持 eturn sometext，返回“\n”。那么如何得到一些测试呢 a=html.fromstring(""" <p class="clearfix"> <i class="xueli"></i> sometext </p> """) a.find(".//i").getparent().text a=html.fromstring（“”）一些文字 """) a、查找（“.//i”）

我想从html代码中提取一些文本，但是下面的代码不支持 eturn sometext，返回“\n”。那么如何得到一些测试呢

a=html.fromstring("""
<p class="clearfix">
<i class="xueli"></i>
sometext
</p>
""")
a.find(".//i").getparent().text

a=html.fromstring（“”）

一些文字

""")
a、 查找（“.//i”）.getparent（）文本

使用

text\u content（）

方法代替

.text

：

In [5]: a.find(".//i").getparent().text_content().strip()
Out[5]: 'sometext'

或者，您可以访问

元素的以下文本同级：

In [6]: a.xpath(".//i/following-sibling::text()")[0].strip()
Out[6]: 'sometext'