Python 使用lxml获取父标记id
我正在尝试抓取一个虚拟站点,并获取我正在搜索的站点的父标记。以下是我正在搜索的代码的结构:Python 使用lxml获取父标记id,python,xpath,web-scraping,lxml,lxml.html,Python,Xpath,Web Scraping,Lxml,Lxml.html,我正在尝试抓取一个虚拟站点,并获取我正在搜索的站点的父标记。以下是我正在搜索的代码的结构: <div id='veg1'> <div class='veg-icon icon'></div> </div> <div id='veg2'> </div> 当veg打印出来时,我得到一个空列表,但我希望得到veg1。由于我没有犯错误,我不确定出了什么问题。正如我在上一个问题中所说的那样,我遵循了这个语法。请参阅
<div id='veg1'>
<div class='veg-icon icon'></div>
</div>
<div id='veg2'>
</div>
当veg打印出来时,我得到一个空列表,但我希望得到veg1。由于我没有犯错误,我不确定出了什么问题。正如我在上一个问题中所说的那样,我遵循了这个语法。请参阅。xpath中很少有错误: 您正在检查类veg图标vegIco,而在HTML中,子div有veg图标 属性的前面是@:@id,而不是id 固定版本:
//div[div[@class="veg-icon icon"]]/@id
//div[div[@class="veg-icon icon"]]/@id