Python中的urllib2出现超时错误

Python中的urllib2出现超时错误,python,urllib2,web-crawler,Python,Urllib2,Web Crawler,我正在构建一个爬虫程序以从站点获取一些数据。到目前为止,我只点击一个URL来测试我的代码。我使用的代码在一段时间内运行良好——现在它给了我错误 我只是在学习Python,所以我不完全确定该怎么做。我确实尝试将套接字超时设置为100,但这并没有改变任何事情。有没有办法解决这个问题 以下是我检索HTML代码的方式: project_html = urlopen(item).read() 我得到的错误是: Traceback (most recent call last): File "link

我正在构建一个爬虫程序以从站点获取一些数据。到目前为止,我只点击一个URL来测试我的代码。我使用的代码在一段时间内运行良好——现在它给了我错误

我只是在学习Python,所以我不完全确定该怎么做。我确实尝试将套接字超时设置为100,但这并没有改变任何事情。有没有办法解决这个问题

以下是我检索HTML代码的方式:

project_html = urlopen(item).read()
我得到的错误是:

Traceback (most recent call last):
  File "linkscanner.py", line 76, in <module>
project_html = urlopen(item).read()
  File "/usr/lib/python2.7/urllib2.py", line 127, in urlopen
return _opener.open(url, data, timeout)
  File "/usr/lib/python2.7/urllib2.py", line 393, in open
protocol = req.get_type()
  File "/usr/lib/python2.7/urllib2.py", line 255, in get_type
raise ValueError, "unknown url type: %s" % self.__original
ValueError: unknown url type: h
回溯(最近一次呼叫最后一次):
文件“linkscanner.py”,第76行,在
project_html=urlopen(item).read()
文件“/usr/lib/python2.7/urllib2.py”,urlopen中的第127行
return\u opener.open(url、数据、超时)
文件“/usr/lib/python2.7/urllib2.py”,第393行,打开
协议=请求获取类型()
文件“/usr/lib/python2.7/urllib2.py”,第255行,get_类型
提升值错误,“未知url类型:%s”%self.\u原始
ValueError:未知的url类型:h

这不是超时错误;看起来您给它的URL无效。仔细检查您是否可以在web浏览器中访问该URL。我可以访问该URL。我甚至试着给它输入“”,这给了我同样的错误。对不起,这句话的措辞很糟糕。您需要在URL中包含协议。试试
http://google.ca
事实上,你是对的。这是一个愚蠢的语法问题。谢谢!