Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/selenium/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用Scrapy抓取ajax页面_Python_Selenium_Scrapy - Fatal编程技术网

Python 使用Scrapy抓取ajax页面

Python 使用Scrapy抓取ajax页面,python,selenium,scrapy,Python,Selenium,Scrapy,我用刮痧一个月了。我能够根据管道中给出的关键字抓取和刮取几个网站(事实上我已经抓取了900个网站)。现在,问题是当我们遇到javapages(ajax)时,scrapy不会刮取。我正在尝试使用以下代码,并进行适当的更改以刮取ajax页面 你们有什么好主意用scrapy抓取javapages吗 第二个问题,我面临的是scrapy不刮登录页面首先监视使用ajax发送的请求(为此使用fiddler或firefox firebug),然后在scrapy中发出类似请求,它将带来响应 我不明白你所说的“刮刮

我用刮痧一个月了。我能够根据管道中给出的关键字抓取和刮取几个网站(事实上我已经抓取了900个网站)。现在,问题是当我们遇到javapages(ajax)时,scrapy不会刮取。我正在尝试使用以下代码,并进行适当的更改以刮取ajax页面

你们有什么好主意用scrapy抓取javapages吗


第二个问题,我面临的是scrapy不刮登录页面

首先监视使用ajax发送的请求(为此使用fiddler或firefox firebug),然后在scrapy中发出类似请求,它将带来响应


我不明白你所说的“刮刮不刮登录页面”是什么意思:
这是否意味着您不能删除需要您登录的页面或登录页面本身

您能否更具体地说明删除登录页面时遇到的问题?提供您正在使用的代码和url。@alecxe。这是我的蜘蛛代码@StevenAlmeroth。我正在尝试使用下载中间件设置,但在**导入gtk**时出错。错误:来自glib.\u glib导入*导入错误:DLL加载失败:无法启动指定的过程“scrapy不刮登录页”。我的意思是说登录页本身。首先谢谢你的回复。我使用firebug来监视和记录xpath(使用ajax发送的请求)。我应该在我的scrpay项目中使用相同的xpath吗?是的,你可以在你的scrapy项目中使用相同的xpath!我想知道,如果你对如何删除登录页面有什么想法吗?好吧,我从来没有遇到过删除登录页面的任何问题,但是对于你的情况(在你尝试删除雅虎登录页面的情况下),首先转到这个作为起始url),然后使用xpath获取登录页面的url,在该url上发出请求,它将可用。这应该行得通