Python 带TOR的刮擦(窗口)
我用几个蜘蛛创建了一个Scrapy项目来抓取一些网站。现在我想用TOR来:Python 带TOR的刮擦(窗口),python,windows,scrapy,tor,Python,Windows,Scrapy,Tor,我用几个蜘蛛创建了一个Scrapy项目来抓取一些网站。现在我想用TOR来: 对爬网服务器隐藏我的ip 将我的请求关联到不同的IP,模拟来自不同用户的访问 我读过一些关于这方面的信息,例如: , 这些链接的答案对我没有帮助。我应该采取什么步骤使Scrapy与TOR正常工作 编辑1: 考虑到答案1,我开始安装TOR。在使用Windows时,我下载了TOR专家包()并阅读了关于如何将TOR配置为中继()的章节。不幸的是,关于如何在Windows上执行此操作的信息很少或几乎没有。如果我解压缩下载的存档文
考虑到答案1,我开始安装TOR。在使用Windows时,我下载了TOR专家包()并阅读了关于如何将TOR配置为中继()的章节。不幸的是,关于如何在Windows上执行此操作的信息很少或几乎没有。如果我解压缩下载的存档文件并运行文件Tor\Tor.exe,则不会发生任何事情。但是,我可以在任务管理器中看到一个新流程被实例化。我不知道从这里开始的最佳方式是什么。这里有详细的分步说明 基本步骤包括:
'scrapy.downloadermiddleware.useragent.UserAgentMiddleware':无,
而不是'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware':无,
你的szenario是什么?你想过租用代理服务器吗?经过大量研究,我找到了一种方法来设置我的Scrapy项目,以便在Windows操作系统上使用TOR:
你已经取得了什么成就?你有什么问题?请编辑您的问题,并向我们解释这些问题,以便我们能够提供帮助。github上的这个scrapy项目解释了如何取消匿名:感谢fmp一步一步地提供帮助。考虑到你的答案,我编辑了我的问题(编辑1个标签)。关于你的最后一个问题“你想过租用代理服务器吗?”如果我用TOR重定向我的流量,为什么我需要租用一些代理服务器?对不起,我没有在windows下运行TOR。您不必租用代理,您的初始问题可以选择隐藏您的“真实”ip(在代理服务器后面),并将您的请求与不同的ip(例如来自代理服务器的ip)关联。如何使polipo与https一起工作?有人能帮忙吗?我正在获取无法打开连接隧道。:已编辑链接6:使用Web存档版本