Python 使用lxml获取值

Python 使用lxml获取值,python,html,html-parsing,lxml,lxml.html,Python,Html,Html Parsing,Lxml,Lxml.html,我有以下html: <div class="txt-block"> <h4 class="inline">Aspect Ratio:</h4> 2.35 : 1 </div> 那么,如何获得“2.35:1”值?使用etree.tostring可以获得完整的输出。这称为元素的.tail: from lxml.html import fromstring data = """ <div class="txt-block"> <h4

我有以下html:

<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>

那么,如何获得“2.35:1”值?使用
etree.tostring
可以获得完整的输出。

这称为元素的
.tail

from lxml.html import fromstring

data = """
<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>
"""

root = fromstring(data)
print root.xpath('//h4[@class="inline"]')[0].tail

另外,请确保您正在使用,因为您正在处理HTML数据。

您也可以使用
.text\u content()
,而不是
.text
,这将为您提供元素()的整个文本内容--

那么,完整的声明将是:

>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1
root.xpath('//h4[@class="inline"]/following-sibling::text()')[0] 
>>> item.find('div').text.text_content()
Aspect Ratio: 2.35 : 1
>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1