Python 使用lxml高效解析元标记?

Python 使用lxml高效解析元标记?,python,screen-scraping,css-selectors,web-scraping,lxml,Python,Screen Scraping,Css Selectors,Web Scraping,Lxml,我正在用lxml解析HTML页面。页面具有如下元标记: <meta property="og:locality" content="Detroit" /> <meta property="og:country-name" content="USA" /> 但感觉效率不高 您可以使用这个XPath选择器://meta[@property='og:locality']/@content我认为lxml支持大多数CSS选择器,因此您可以使用: 如果您愿意使用另一个纯Python

我正在用lxml解析HTML页面。页面具有如下元标记:

<meta property="og:locality" content="Detroit" />
<meta property="og:country-name" content="USA" />

但感觉效率不高

您可以使用这个XPath选择器:
//meta[@property='og:locality']/@content
我认为lxml支持大多数CSS选择器,因此您可以使用:


如果您愿意使用另一个纯Python库,可以选择

来自gazpacho进口汤的

html=”“”\
"""
汤=汤(html)
要准确解析您要查找的内容,您只需请求:

soup.find(“meta”,{“property”:“og:locality”}).attrs['content']
这将产生:

“底特律”


你错过了
@内容
没有
tree=fromstring(html_数据)tree.xpath(//meta[@property='og:locality']/@content”)
for meta in doc3.cssselect('meta'):
    prop = meta.get('property')
    if prop === 'og:locality':
        lat = meta.get('content')
doc3.cssselect('meta[property="og:locality"]')[0].get('content')