Python中的urllib2出现超时错误_Python_Urllib2_Web Crawler

Python中的urllib2出现超时错误

python web-crawler

Python中的urllib2出现超时错误,python,urllib2,web-crawler,Python,Urllib2,Web Crawler,我正在构建一个爬虫程序以从站点获取一些数据。到目前为止，我只点击一个URL来测试我的代码。我使用的代码在一段时间内运行良好——现在它给了我错误我只是在学习Python，所以我不完全确定该怎么做。我确实尝试将套接字超时设置为100，但这并没有改变任何事情。有没有办法解决这个问题以下是我检索HTML代码的方式： project_html = urlopen(item).read() 我得到的错误是： Traceback (most recent call last): File "link

我正在构建一个爬虫程序以从站点获取一些数据。到目前为止，我只点击一个URL来测试我的代码。我使用的代码在一段时间内运行良好——现在它给了我错误

我只是在学习Python，所以我不完全确定该怎么做。我确实尝试将套接字超时设置为100，但这并没有改变任何事情。有没有办法解决这个问题

以下是我检索HTML代码的方式：

project_html = urlopen(item).read()

我得到的错误是：

Traceback (most recent call last):
  File "linkscanner.py", line 76, in <module>
project_html = urlopen(item).read()
  File "/usr/lib/python2.7/urllib2.py", line 127, in urlopen
return _opener.open(url, data, timeout)
  File "/usr/lib/python2.7/urllib2.py", line 393, in open
protocol = req.get_type()
  File "/usr/lib/python2.7/urllib2.py", line 255, in get_type
raise ValueError, "unknown url type: %s" % self.__original
ValueError: unknown url type: h

回溯（最近一次呼叫最后一次）：
文件“linkscanner.py”，第76行，在
project_html=urlopen（item）.read（）
文件“/usr/lib/python2.7/urllib2.py”，urlopen中的第127行
return\u opener.open（url、数据、超时）
文件“/usr/lib/python2.7/urllib2.py”，第393行，打开
协议=请求获取类型（）
文件“/usr/lib/python2.7/urllib2.py”，第255行，get_类型
提升值错误，“未知url类型：%s”%self.\u原始
ValueError:未知的url类型：h

这不是超时错误；看起来您给它的URL无效。仔细检查您是否可以在web浏览器中访问该URL。我可以访问该URL。我甚至试着给它输入“”，这给了我同样的错误。对不起，这句话的措辞很糟糕。您需要在URL中包含协议。试试

http://google.ca

事实上，你是对的。这是一个愚蠢的语法问题。谢谢！