Python 3.x python 3.X urllib.request http错误416
我想从一个网站上获取信息。下面是它的简单代码Python 3.x python 3.X urllib.request http错误416,python-3.x,urllib,Python 3.x,Urllib,我想从一个网站上获取信息。下面是它的简单代码 import urllib.request response = urllib.request.urlopen('http://www.lamudi.com.ph/buy/?page=1&size=30') html = response.read() 我收到一个urllib.error.HTTPError:HTTP error 416:请求的范围不可满足此特定网站不希望机器人读取内容。urllib.request.urlopen的问题是,
import urllib.request
response = urllib.request.urlopen('http://www.lamudi.com.ph/buy/?page=1&size=30')
html = response.read()
我收到一个
urllib.error.HTTPError:HTTP error 416:请求的范围不可满足
此特定网站不希望机器人读取内容。urllib.request.urlopen
的问题是,它会在4xx或5xx返回代码上引发异常,从而很难看到来自服务器的实际响应。一个更好的图书馆会更好
如果您得到响应,您将看到:
当你浏览的时候http://.... 你的浏览器让我们觉得你是个机器人
您应该与他们核实是否可以使用他们的信息,但如果这是供您个人使用的,您可以尝试将用户代理更改为浏览器使用的用户代理。感谢您的快速响应。我将查看“请求”模块,并与他们核实有关信息。