Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ajax/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止_Python 3.x_Web Scraping_Google Compute Engine - Fatal编程技术网

Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止

Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止,python-3.x,web-scraping,google-compute-engine,Python 3.x,Web Scraping,Google Compute Engine,我用python3.6编写了一个web scraper,它在我自己的服务器上运行良好 当我试图在我的googlecomputeengine上运行它(完全相同的URL)时,它失败了,出现HTTP错误403:probled 我的服务器上的代码和结果 同样,它工作得很好 >>> import urllib.request >>> from bs4 import BeautifulSoup >>> response = urllib.request.

我用python3.6编写了一个web scraper,它在我自己的服务器上运行良好

当我试图在我的
googlecomputeengine
上运行它(完全相同的URL)时,它失败了,出现
HTTP错误403:probled

我的服务器上的代码和结果 同样,它工作得很好

>>> import urllib.request
>>> from bs4 import BeautifulSoup
>>> response = urllib.request.urlopen("http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>> print(response.readline())
b'<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> -->\r\n'
导入urllib.request >>>从bs4导入BeautifulSoup >>>response=urllib.request.urlopen(“http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1") >>>打印(response.readline()) b'\r\n' 谷歌计算引擎的搜索结果


我认为它不是被url所在的服务器阻止的,而是被GCE阻止的。

经过一系列测试,我发现另一台服务器正在阻止来自不需要的国家的访问

我设置了
http\u代理
,它现在可以工作了


@Supratik Majumdar感谢您的帮助。

您能检查一下GCP上的防火墙设置并确保端口80在同一台计算机上是打开的吗?您能给我一些关于“在同一台计算机上”的详细信息吗?VPC网络>防火墙规则我添加了在这两台计算机上都接受所有端口0.0.0.0/0的规则。(内/外边界)但它仍然不起作用。默认情况下,此URL会给出403响应