Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止
我用python3.6编写了一个web scraper,它在我自己的服务器上运行良好 当我试图在我的Python 3.x 我的刮刀不工作谷歌计算引擎与403禁止,python-3.x,web-scraping,google-compute-engine,Python 3.x,Web Scraping,Google Compute Engine,我用python3.6编写了一个web scraper,它在我自己的服务器上运行良好 当我试图在我的googlecomputeengine上运行它(完全相同的URL)时,它失败了,出现HTTP错误403:probled 我的服务器上的代码和结果 同样,它工作得很好 >>> import urllib.request >>> from bs4 import BeautifulSoup >>> response = urllib.request.
googlecomputeengine
上运行它(完全相同的URL)时,它失败了,出现HTTP错误403:probled
我的服务器上的代码和结果
同样,它工作得很好
>>> import urllib.request
>>> from bs4 import BeautifulSoup
>>> response = urllib.request.urlopen("http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>> print(response.readline())
b'<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> -->\r\n'
导入urllib.request
>>>从bs4导入BeautifulSoup
>>>response=urllib.request.urlopen(“http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>>打印(response.readline())
b'\r\n'
谷歌计算引擎的搜索结果
我认为它不是被url所在的服务器阻止的,而是被GCE阻止的。经过一系列测试,我发现另一台服务器正在阻止来自不需要的国家的访问 我设置了
http\u代理
,它现在可以工作了
@Supratik Majumdar感谢您的帮助。您能检查一下GCP上的防火墙设置并确保端口80在同一台计算机上是打开的吗?您能给我一些关于“在同一台计算机上”的详细信息吗?VPC网络>防火墙规则我添加了在这两台计算机上都接受所有端口0.0.0.0/0的规则。(内/外边界)但它仍然不起作用。默认情况下,此URL会给出403响应