Python 如何使用lxml.HTML库解析HTML_Python_Lxml.html

Python 如何使用lxml.HTML库解析HTML

python

Python 如何使用lxml.HTML库解析HTML,python,lxml.html,Python,Lxml.html,以下是出现在我的网站上的HTML： <meta content="auth" name="param" /> <meta content="I_WANT_THIS" name="token" /> 如何使用来获取它？通过name属性查找meta标记，并获取content属性的值： from lxml.html import fromstring html_data = """ <meta content="auth" name="param" />

以下是出现在我的网站上的

HTML

：

<meta content="auth" name="param" />
<meta content="I_WANT_THIS" name="token" />

如何使用来获取它？

通过

name

属性查找

meta

标记，并获取

content

属性的值：

from lxml.html import fromstring


html_data = """ <meta content="auth" name="param" />
 <meta content="I_WANT_THIS" name="token" />"""

tree = fromstring(html_data)
print tree.xpath('//meta[@name="token"]/@content')

你能解释一下“//meta[@name=“token”]/@content'”是什么吗？@user3412816是的，这是一个xpath表达式，基本上是这样说的：在html中的任何地方找到我

meta

标记，这个meta标记显示有一个属性

name

和值

token

，然后给我

content

属性的值。

['I_WANT_THIS']