Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止_Python 3.x_Web Scraping_Google Compute Engine

Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止

python-3.x web-scraping google-compute-engine

Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止,python-3.x,web-scraping,google-compute-engine,Python 3.x,Web Scraping,Google Compute Engine,我用python3.6编写了一个web scraper，它在我自己的服务器上运行良好当我试图在我的googlecomputeengine上运行它（完全相同的URL）时，它失败了，出现HTTP错误403:probled 我的服务器上的代码和结果同样，它工作得很好 >>> import urllib.request >>> from bs4 import BeautifulSoup >>> response = urllib.request.

我用python3.6编写了一个web scraper，它在我自己的服务器上运行良好

当我试图在我的

googlecomputeengine

上运行它（完全相同的URL）时，它失败了，出现

HTTP错误403:probled

我的服务器上的代码和结果同样，它工作得很好

>>> import urllib.request
>>> from bs4 import BeautifulSoup
>>> response = urllib.request.urlopen("http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>> print(response.readline())
b'<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> -->\r\n'

导入urllib.request >>>从bs4导入BeautifulSoup >>>response=urllib.request.urlopen（“http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1") >>>打印（response.readline（）） b'\r\n' 谷歌计算引擎的搜索结果

我认为它不是被url所在的服务器阻止的，而是被GCE阻止的。

经过一系列测试，我发现另一台服务器正在阻止来自不需要的国家的访问

我设置了

http\u代理

，它现在可以工作了

@Supratik Majumdar感谢您的帮助。

您能检查一下GCP上的防火墙设置并确保端口80在同一台计算机上是打开的吗？您能给我一些关于“在同一台计算机上”的详细信息吗？VPC网络>防火墙规则我添加了在这两台计算机上都接受所有端口0.0.0.0/0的规则。（内/外边界）但它仍然不起作用。默认情况下，此URL会给出403响应