使用xPath解析元标记
如何解析元标记,例如使用xPath解析元标记,xpath,xml-parsing,web-scraping,Xpath,Xml Parsing,Web Scraping,如何解析元标记,例如 <meta itemprop="email" content="email@example.com" class=""> 请告知 非常感谢itemprop=“email”属性在整个网页中可能是唯一的。在这种情况下,您可以通过其XPath访问content属性来选择电子邮件,如下所示: //meta[@itemprop="email"]/@content 如果itemprop=“email”不是唯一的,您可以通过选择id等于businessdetailspr
<meta itemprop="email" content="email@example.com" class="">
请告知
非常感谢
itemprop=“email”
属性在整个网页中可能是唯一的。在这种情况下,您可以通过其XPath
访问content
属性来选择电子邮件,如下所示:
//meta[@itemprop="email"]/@content
如果itemprop=“email”
不是唯一的,您可以通过选择id
等于businessdetailsprismary
的元素,使您的XPath
更加具体:
//*[@id="businessDetailsPrimary"]//meta[@itemprop="email"]/@content
非常感谢您的及时回复。它工作得很好。还有一件事,我也尝试使用xPath提取地址,但地址在页面中的位置并不总是相同的,例如:……有什么方法可以处理这种情况吗?
//*[@id="businessDetailsPrimary"]//meta[@itemprop="email"]/@content