Python 如何从这个javascript网站抓取图像?

Python 如何从这个javascript网站抓取图像?,python,scripting,web-crawler,Python,Scripting,Web Crawler,这是来自数字图书库的链接。有前进和后退按钮可查看下一页和上一页。我想自动下载这些图片。我曾经在python中使用过urllib,但网站很快就将其禁用。我只是想下载这本书作为学习之用,所以有谁能给我推荐一些编程工具,比如Webspider,它可以模拟翻页的过程并自动获取图片。谢谢 wget是一种优秀的网络蜘蛛 该站点使用Javascript,因此您不能轻易地用Python将其删除。两项建议: 单击“下一步”按钮时,计算出正在发出的请求。您可以使用firebug之类的工具来实现这一点。然后,您可能会

这是来自数字图书库的链接。有前进和后退按钮可查看下一页和上一页。我想自动下载这些图片。我曾经在python中使用过urllib,但网站很快就将其禁用。我只是想下载这本书作为学习之用,所以有谁能给我推荐一些编程工具,比如Webspider,它可以模拟翻页的过程并自动获取图片。谢谢

wget是一种优秀的网络蜘蛛


该站点使用Javascript,因此您不能轻易地用Python将其删除。两项建议:

单击“下一步”按钮时,计算出正在发出的请求。您可以使用firebug之类的工具来实现这一点。然后,您可能会发现您可以在不处理任何JS的情况下刮取它

使用允许浏览器脚本的工具,可以执行JS

对于阻止你的网站,有两种方法可以降低被阻止的几率:

将您的用户代理更改为普通浏览器的用户代理,例如Firefox

在访问下一幅图像之间添加随机延迟,使您看起来更像人类


你需要一个真正的浏览器来处理这种网站。Selenium是一种选择,但它更适合web测试。对于网页抓取,iMacros真的很不错。我做了一个快速测试,它可以很好地与iMacros for Firefox/IE配合使用

克里斯