Python urllib2错误403:禁止

Python urllib2错误403:禁止,python,urllib2,Python,Urllib2,我已经发布到这个网站,并收到了非常有用的指导,我返回另一个问题 我在这里哪里出了问题,我很确定这是访问各种网站信息所必需的。在这种情况下,CME组 import urllib2 url = "http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html" request= urllib2.Request(url) handle = urllib2.urlopen(request) content = handle.

我已经发布到这个网站,并收到了非常有用的指导,我返回另一个问题

我在这里哪里出了问题,我很确定这是访问各种网站信息所必需的。在这种情况下,CME组

   import urllib2

url = "http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html"
request= urllib2.Request(url)
handle = urllib2.urlopen(request)
content = handle.read()
splitted_page = content.split("<span class=\"cmeSubHeading\">", 1);
splitted_page = splitted_page[1].split("</span>", 1)
print splitted_page[0]

提前非常感谢。

实际上,问题是他们阻止了所有没有用户代理的人

import urllib2

request = urllib2.Request("http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html", None, {'User-Agent': 'Mozilla/5.0'})
content = urllib2.urlopen(request).read()
splitted_page = content.split("<span class=\"cmeSubHeading\">", 1);
splitted_page = splitted_page[1].split("</span>", 1)
print splitted_page[0]
导入urllib2
请求=urllib2。请求(“http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html,无,{'User-Agent':'Mozilla/5.0'})
content=urllib2.urlopen(请求).read()
拆分的页面=content.split(“,1);
拆分的页面=拆分的页面[1]。拆分(“,1”)
打印拆分的页面[0]

如果必须获取请求,我建议将请求python包发送给您。您可以在中阅读它的优点


但是,如果您收到403消息,可能您正在尝试访问某些受限数据()。

您需要模拟用户代理,以便服务器不会认为您是“坏人”
import urllib2

request = urllib2.Request("http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html", None, {'User-Agent': 'Mozilla/5.0'})
content = urllib2.urlopen(request).read()
splitted_page = content.split("<span class=\"cmeSubHeading\">", 1);
splitted_page = splitted_page[1].split("</span>", 1)
print splitted_page[0]