Python 仅当div类包含某个单词时,才使用xpath从该类中提取信息
我正试图从以下网站上搜集信息 然而,有时信息会改变它的位置。 我很难只检查“建筑物大小”并将其存储为大小,因为div类如下所示:Python 仅当div类包含某个单词时,才使用xpath从该类中提取信息,python,xpath,web-scraping,scrapy,Python,Xpath,Web Scraping,Scrapy,我正试图从以下网站上搜集信息 然而,有时信息会改变它的位置。 我很难只检查“建筑物大小”并将其存储为大小,因为div类如下所示: <div class="features__item"> <div class="features__icon icon-house" aria-hidden="true"></div> <div class="features__label">Building Size 130m
<div class="features__item">
<div class="features__icon icon-house" aria-hidden="true"></div>
<div class="features__label">Building Size 130m²</div>
</div>
我想要的是建筑物尺寸信息(只有数字),如果它存在的话,如果没有可用的建筑物尺寸,则不放任何信息。在div课上,我正在努力学习课文部分。我已经尝试构建一个for循环来检查它是否包含“Building Size”(建筑尺寸),但是没有任何效果。任何帮助都将不胜感激!谢谢大家! 简单:
size = response.xpath("//div[@class='features__label'][contains(., 'Building Size')]/text()").re_first(r'\d+')
多谢各位@甘加巴斯
size = response.xpath("//div[@class='features__label'][contains(., 'Building Size')]/text()").re_first(r'\d+')