刮痧+;Xpath+;Python:无法刮取数据点
我想在这里抓取URL: 我试过这些:刮痧+;Xpath+;Python:无法刮取数据点,python,xpath,scrapy,web-crawler,Python,Xpath,Scrapy,Web Crawler,我想在这里抓取URL: 我试过这些: response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract() response.xpath('//div[class="geodir-content "]/header/a/@href').extract() response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-hea
response.xpath('//header[@class="geodir-entry-header"]/a/@href').extract()
response.xpath('//div[class="geodir-content "]/header/a/@href').extract()
response.xpath('//div[@class="geodir-content "]/header[@class="geodir-entry-header"]/a/@href').extract()
所有人都返回了一个空列表。
response.xpath('//h3[@class=“geodir entry title”]/a/@href').extract()
或
response.xpath('//header[@class=“geodir entry header”]/h3/a/@href').extract()
为你工作
看起来您刚刚错过了h3
标记,该标记包含您需要的a
标记。没有
response.xpath('//h3[@class=“geodir entry title”]/a/@href').extract()
或
response.xpath('//header[@class=“geodir entry header”]/h3/a/@href').extract()
为你工作
看起来您刚刚错过了包含所需的
a
标记的h3
标记。您只需添加意外错过的h3标记即可
response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()
&如果只想获取第一个url,请添加
response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()
或
你所需要的只是添加你不小心错过的h3标签
response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract()
&如果只想获取第一个url,请添加
response.xpath('//header[@class="geodir-entry-header"]/h3/a/@href').extract_first()
或
@黛比,我想你知道答案了@黛比,我想你知道答案了!