刮痧+；Xpath+；Python:无法刮取数据点_Python_Xpath_Scrapy_Web Crawler

刮痧+；Xpath+；Python:无法刮取数据点

python xpath scrapy web-crawler

刮痧+；Xpath+；Python:无法刮取数据点,python,xpath,scrapy,web-crawler,Python,Xpath,Scrapy,Web Crawler,我想在这里抓取URL：我试过这些： response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract() response.xpath('//div[class="geodir-content "]/header/a/@href').extract() response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-hea

我想在这里抓取URL：

我试过这些：

response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract()

response.xpath('//div[class="geodir-content "]/header/a/@href').extract()

response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-header"]/a/@href').extract()

所有人都返回了一个空列表。

response.xpath（'//h3[@class=“geodir entry title”]/a/@href'）.extract（）

或

response.xpath（'//header[@class=“geodir entry header”]/h3/a/@href'）.extract（）

为你工作

看起来您刚刚错过了

h3

标记，该标记包含您需要的

标记。

没有

response.xpath（'//h3[@class=“geodir entry title”]/a/@href'）.extract（）

或

response.xpath（'//header[@class=“geodir entry header”]/h3/a/@href'）.extract（）

为你工作

看起来您刚刚错过了包含所需的

标记的

h3

标记。

您只需添加意外错过的h3标记即可

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()

&如果只想获取第一个url，请添加

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()

或

你所需要的只是添加你不小心错过的h3标签

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()

&如果只想获取第一个url，请添加

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()

或

@黛比，我想你知道答案了@黛比，我想你知道答案了！