Python Scrapy代理在几轮之后就死了?
我想用scrapy构建一个亚马逊爬虫 它起作用了,但是在大约10个好的代理之后,每一个代理都会失效 我不明白为什么 那是我的中间产品Python Scrapy代理在几轮之后就死了?,python,scrapy,Python,Scrapy,我想用scrapy构建一个亚马逊爬虫 它起作用了,但是在大约10个好的代理之后,每一个代理都会失效 我不明白为什么 那是我的中间产品 DOWNLOADER_MIDDLEWARES = { 'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None, 'scrapy_user_agents.middlewares.RandomUserAgentMiddleware': 400, 'rotating_
DOWNLOADER_MIDDLEWARES = {
'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,
'scrapy_user_agents.middlewares.RandomUserAgentMiddleware': 400,
'rotating_proxies.middlewares.RotatingProxyMiddleware': 610,
'rotating_proxies.middlewares.BanDetectionMiddleware': 620,
}
我有1000个代理,大多数都没有死,几乎所有的代理都在另一个爬虫上工作,但在几轮之后,没有在亚马逊上工作
有人有主意吗?
用户代理工作,代理也旋转,他在每一个“死”代理上显示不同的IP和其他东西
这是一本日志
2019-11-06 21:52:40 [rotating_proxies.expire] DEBUG: Proxy <http://XXX:XXX@XXXX:8080> is DEAD
2019-11-06 21:52:40 [rotating_proxies.middlewares] DEBUG: Retrying <GET https://www.amazon.de/gp/offer-listing/B00VB2ISDM/ref=olp_f_used?f_primeEligible=true&f_usedAcceptable=true&f_usedGood=true&f_used=true&f_usedLikeNew=true&f_usedVeryGood=true> with another proxy (failed 9 times, max retries: 300)
2019-11-06 21:52:40 [scrapy_user_agents.middlewares] DEBUG: Proxy is detected http://xxxx:8080
无济于事亚马逊采用了先进的反机器人措施
使用智能代理或其他代理服务,提供良好的IP轮换和其他网络爬网功能。亚马逊采用先进的反机器人措施
使用智能代理或其他代理服务,提供良好的IP轮换和其他网络爬网功能。哦,好的,可以免费使用吗?我的意思是我有自己的1000个代理什么是crawlera的替代代理?我的意思是每月15万的请求对亚马逊来说不算多。。。它在几个小时内完成:/和其他pakets,超过50美元是非常高的价格好的,是免费使用吗?我的意思是我有自己的1000个代理什么是crawlera的替代代理?我的意思是每月15万的请求对亚马逊来说不算多。。。它在几个小时内就完成了:/和其他小包,超过50美元的价格真的很高
DOWNLOAD_DELAY = 5
AUTOTHROTTLE_ENABLED = True
AUTOTHROTTLE_START_DELAY = 20
AUTOTHROTTLE_MAX_DELAY = 60