Python 使用lxml获取值
我有以下html:Python 使用lxml获取值,python,html,html-parsing,lxml,lxml.html,Python,Html,Html Parsing,Lxml,Lxml.html,我有以下html: <div class="txt-block"> <h4 class="inline">Aspect Ratio:</h4> 2.35 : 1 </div> 那么,如何获得“2.35:1”值?使用etree.tostring可以获得完整的输出。这称为元素的.tail: from lxml.html import fromstring data = """ <div class="txt-block"> <h4
<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>
那么,如何获得“2.35:1”值?使用
etree.tostring
可以获得完整的输出。这称为元素的.tail
:
from lxml.html import fromstring
data = """
<div class="txt-block">
<h4 class="inline">Aspect Ratio:</h4> 2.35 : 1
</div>
"""
root = fromstring(data)
print root.xpath('//h4[@class="inline"]')[0].tail
另外,请确保您正在使用,因为您正在处理HTML数据。您也可以使用
.text\u content()
,而不是.text
,这将为您提供元素()的整个文本内容--
那么,完整的声明将是:
>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1
root.xpath('//h4[@class="inline"]/following-sibling::text()')[0]
>>> item.find('div').text.text_content()
Aspect Ratio: 2.35 : 1
>>> title_detail.text_content().split('Aspect Ratio: ')[1].strip()
2.35 : 1