403';访问被拒绝';在Python中使用urllib2打开网页时出错
我试图通过打开这个url,403';访问被拒绝';在Python中使用urllib2打开网页时出错,python,dictionary,urllib2,webpage,access-denied,Python,Dictionary,Urllib2,Webpage,Access Denied,我试图通过打开这个url,https://www.google.com/search?q=define+并解析定义的源代码。然而,当我试图访问该页面时,我得到一个403错误,据推测是为了防止以这种方式进行数据挖掘。我相当肯定,试图绕过这一点是不明智的,所以我想知道是否有从谷歌服务器访问数据的替代方案,或者我应该使用的数据转储 编辑:这里是我用来访问URL的代码范围 url = "https://www.google.com/search?q=define+" + word try: so
https://www.google.com/search?q=define+
并解析定义的源代码。然而,当我试图访问该页面时,我得到一个403错误,据推测是为了防止以这种方式进行数据挖掘。我相当肯定,试图绕过这一点是不明智的,所以我想知道是否有从谷歌服务器访问数据的替代方案,或者我应该使用的数据转储
编辑:这里是我用来访问URL的代码范围
url = "https://www.google.com/search?q=define+" + word
try:
source = ulib.urlopen(url)
except ulib.HTTPError, e:
print e.fp.read()
我们需要查看您的代码以进行确认,但您的问题可能已得到回答。简而言之,您需要定义您的用户代理。我们需要检查您正在使用的代码,以查看出了什么问题。在Chrome上使用特定URL进行测试,该URL带有某物的值,确实允许访问。