刮痧+;Xpath+;Python:无法刮取数据点

刮痧+;Xpath+;Python:无法刮取数据点,python,xpath,scrapy,web-crawler,Python,Xpath,Scrapy,Web Crawler,我想在这里抓取URL: 我试过这些: response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract() response.xpath('//div[class="geodir-content "]/header/a/@href').extract() response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-hea

我想在这里抓取URL:

我试过这些:

response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract()

response.xpath('//div[class="geodir-content "]/header/a/@href').extract()

response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-header"]/a/@href').extract()
所有人都返回了一个空列表。

response.xpath('//h3[@class=“geodir entry title”]/a/@href').extract()
response.xpath('//header[@class=“geodir entry header”]/h3/a/@href').extract()

为你工作

看起来您刚刚错过了
h3
标记,该标记包含您需要的
a
标记。

没有

response.xpath('//h3[@class=“geodir entry title”]/a/@href').extract()
response.xpath('//header[@class=“geodir entry header”]/h3/a/@href').extract()

为你工作


看起来您刚刚错过了包含所需的
a
标记的
h3
标记。

您只需添加意外错过的h3标记即可

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()
&如果只想获取第一个url,请添加

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()


你所需要的只是添加你不小心错过的h3标签

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()
&如果只想获取第一个url,请添加

response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()


@黛比,我想你知道答案了@黛比,我想你知道答案了!