Python 使用lxml获取值_Python_Html_Html Parsing_Lxml_Lxml.html

Python 使用lxml获取值

python html

Python 使用lxml获取值,python,html,html-parsing,lxml,lxml.html,Python,Html,Html Parsing,Lxml,Lxml.html,我有以下html： <div class="txt-block"> <h4 class="inline">Aspect Ratio:</h4> 2.35 : 1 </div> 那么，如何获得“2.35:1”值？使用etree.tostring可以获得完整的输出。这称为元素的.tail： from lxml.html import fromstring data = """ <div class="txt-block"> <h4

我有以下html：

<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>

那么，如何获得“2.35:1”值？使用

etree.tostring

可以获得完整的输出。

这称为元素的

.tail

：

from lxml.html import fromstring

data = """
<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>
"""

root = fromstring(data)
print root.xpath('//h4[@class="inline"]')[0].tail

另外，请确保您正在使用，因为您正在处理HTML数据。

您也可以使用

.text\u content（）

，而不是

.text

，这将为您提供元素（）的整个文本内容--

那么，完整的声明将是：

>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1

root.xpath('//h4[@class="inline"]/following-sibling::text()')[0]

>>> item.find('div').text.text_content()
Aspect Ratio: 2.35 : 1

>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1