Shell 如何使用scrapy response.xpath提取HTML属性的值?
我正试图提取Shell 如何使用scrapy response.xpath提取HTML属性的值?,shell,xpath,scrapy,Shell,Xpath,Scrapy,我正试图提取标记中price中属性数据的值 在下面的示例中,您可以看到的是22.63 <div id="cerberus-data-metrics" style="display: none;" data-asin="B079GMRZ8S" data-asin-price="22.63" data-asin-shipping="0.0" data-asin-currency-code="AUD" data-substitute-count="-1" data-device-type="WE
标记中price中属性数据的值
在下面的示例中,您可以看到的是22.63
<div id="cerberus-data-metrics" style="display: none;" data-asin="B079GMRZ8S" data-asin-price="22.63" data-asin-shipping="0.0" data-asin-currency-code="AUD" data-substitute-count="-1" data-device-type="WEB" data-display-code="Asin is not eligible because it is not enabled"></div>
使用response.xpath()和scrapy有什么方法可以做到这一点吗
谢谢我只是想把我找到的答案贴出来
为了获得scrapy shell中作为价格属性的数据的22.63值,我执行了以下操作:
response.xpath('//div[@id = "cerberus-data-metrics"]/@data-asin-price').extract_first()
干杯回答您自己的问题可能会重复您的出色工作。为了清楚起见,我编辑了你的问题和答案。实际上,您正在尝试提取属性的值,而不是元素的值。HTML/XML元素是标记和其中的所有内容。这些属性包括style
、id
和href
等,以及它们的值,这些值显示在标记的开头部分。了解这一点将有助于您将来找到答案。@pwinz感谢您的编辑和澄清。这对我将来肯定有帮助。当做