Python 使用lxml高效解析元标记？_Python_Screen Scraping_Css Selectors_Web Scraping_Lxml

Python 使用lxml高效解析元标记？

python web-scraping

Python 使用lxml高效解析元标记？,python,screen-scraping,css-selectors,web-scraping,lxml,Python,Screen Scraping,Css Selectors,Web Scraping,Lxml,我正在用lxml解析HTML页面。页面具有如下元标记： <meta property="og:locality" content="Detroit" /> <meta property="og:country-name" content="USA" /> 但感觉效率不高您可以使用这个XPath选择器：//meta[@property='og:locality']/@content我认为lxml支持大多数CSS选择器，因此您可以使用：如果您愿意使用另一个纯Python

我正在用lxml解析HTML页面。页面具有如下元标记：

<meta property="og:locality" content="Detroit" />
<meta property="og:country-name" content="USA" />

但感觉效率不高

您可以使用这个XPath选择器：

//meta[@property='og:locality']/@content

我认为lxml支持大多数CSS选择器，因此您可以使用：

如果您愿意使用另一个纯Python库，可以选择

来自gazpacho进口汤的


html=”“”\
"""
汤=汤（html）

要准确解析您要查找的内容，您只需请求：

soup.find（“meta”，{“property”：“og:locality”}）.attrs['content']

这将产生：

“底特律”

你错过了

@内容

没有

tree=fromstring（html_数据）tree.xpath（//meta[@property='og:locality']/@content”）

for meta in doc3.cssselect('meta'):
    prop = meta.get('property')
    if prop === 'og:locality':
        lat = meta.get('content')

doc3.cssselect('meta[property="og:locality"]')[0].get('content')