Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/341.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在其他国家/地区使用Web刮板_Python_Web Scraping_Python Requests - Fatal编程技术网

Python 在其他国家/地区使用Web刮板

Python 在其他国家/地区使用Web刮板,python,web-scraping,python-requests,Python,Web Scraping,Python Requests,我写过很多网站搜索工具,它们搜索特定国家的网站,比如ebay.co.uk,它们通过操纵url来获得特定的结果。为此,我使用Python3和请求模块 当我在英国使用它们时,它们工作得很好,我现在尝试在另一个国家西班牙运行它们,但它们不再工作了 如果我直接在web浏览器中使用相同的URL,页面URL会像以前一样加载,就是这样。现在我在另一个国家,我需要使用一个代理来访问相同的URL,使用以前从未使用过代理的请求吗 非常感谢 编辑: 好的,这仍然部分有效,请参见代码: import requests,

我写过很多网站搜索工具,它们搜索特定国家的网站,比如ebay.co.uk,它们通过操纵url来获得特定的结果。为此,我使用Python3和请求模块

当我在英国使用它们时,它们工作得很好,我现在尝试在另一个国家西班牙运行它们,但它们不再工作了

如果我直接在web浏览器中使用相同的URL,页面URL会像以前一样加载,就是这样。现在我在另一个国家,我需要使用一个代理来访问相同的URL,使用以前从未使用过代理的请求吗

非常感谢

编辑:

好的,这仍然部分有效,请参见代码:

import requests, bs4

# Tesco Outlet
URL1 = "http://www.ebay.co.uk/sch/tesco_outlet/m.html?
_nkw=&_armrs=1&_ipg=&_from="

# Sold Iphones
URL2 = "http://www.ebay.co.uk/sch/i.html?LH_Auction=1&_nkw=iphone&LH_Complete=1&LH_Sold=1&rt=nc&_trksid=p2045573.m1684"

session = requests.Session()
res = requests.get(URL2)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, 'html.parser')

results = soup.find(class_="rcnt")
print(results)

next_page = soup.find(class_="gspr next")
print(next_page)

mainContainer = soup.find(id="mainContent")
print(mainContainer)

URL1似乎没有带来任何结果,也没有找到下一页或该页的主容器。但在URL2上,一切似乎都很好。这两个URL在broswer中都很好,所以我不确定为什么URL1不能产生预期的结果。

如果您询问如何在请求中使用代理,您可以制作一个字典并在proxy参数中传递它,例如:

proxy = 'http://127.0.0.1:8000'  ## protocol :// host : port ##
res = requests.get(URL2, proxies={ 'http' : proxy })

我曾经使用代理做过类似的事情,以前也没有,但是如果没有具体的例子,我真的帮不上忙。你能包括一些你的代码吗?和你写的代码吗?代码和更新添加。谢谢