Python scrapy shell返回不同的结果,而脚本返回不同的结果
我正在尝试刮取此URL“” 我的xpath如下所示Python scrapy shell返回不同的结果,而脚本返回不同的结果,python,xpath,scrapy,scrapy-spider,Python,Xpath,Scrapy,Scrapy Spider,我正在尝试刮取此URL“” 我的xpath如下所示 //a[@class="product_img_link"]//@href 当我使用ScrapyShell时,它返回122行,在浏览器中返回135行。这是一个很奇怪的问题。我使用response.body检查了html,并将其保存到html文件中,在浏览器中打开该文件,然后运行xpath,它工作得非常好 任何帮助都应该感谢。好吧,Scrapy不会解析Javascript,所以这可能是您得到不匹配的原因;一些Javascript代码可能正在插入
//a[@class="product_img_link"]//@href
当我使用ScrapyShell时,它返回122行,在浏览器中返回135行。这是一个很奇怪的问题。我使用response.body
检查了html,并将其保存到html文件中,在浏览器中打开该文件,然后运行xpath,它工作得非常好
任何帮助都应该感谢。好吧,Scrapy不会解析Javascript,所以这可能是您得到不匹配的原因;一些Javascript代码可能正在插入这些额外的HREF
如果是这样的话——如果那些缺失的HREF是相关的——那么您需要使用或完全放弃Scrapy,并使用类似的东西,例如,情况并非如此。没有涉及Javascript。奇怪。。。不知道,伙计,对不起。在任何情况下,您都应该发布有关问题的更多信息。如果安装了Scrapy,您可以使用以下命令检查Scrapy shell“”,然后使用len(hxs.select('//a[@class=“product\u img\u link”]//@href'))。您将获得122条记录,同样的方法,在Chrome或Firefox中尝试xpath,您将获得135条记录。