Python wget给出响应错误:418未使用
我正在尝试运行Python wget给出响应错误:418未使用,python,linux,http,wget,Python,Linux,Http,Wget,我正在尝试运行wgethttp://about.me/xxxxxx,指向about.me的个人页面。这样做会得到响应:错误418未使用 我还尝试使用urllib2编写python脚本来下载相同的页面,但得到了相同的响应 此外,尝试https而不是http会重定向到http 当然,如果我通常尝试使用chrome浏览页面,页面会显示。知道wget为什么会给出这种奇怪的http响应吗 如何下载我想要的页面?我做了一系列实验,他们似乎在寻找Accept Language标题 >>> i
wgethttp://about.me/xxxxxx
,指向about.me的个人页面。这样做会得到响应:错误418未使用
我还尝试使用urllib2编写python脚本来下载相同的页面,但得到了相同的响应
此外,尝试https而不是http会重定向到http
当然,如果我通常尝试使用chrome浏览页面,页面会显示。知道wget为什么会给出这种奇怪的http响应吗
如何下载我想要的页面?我做了一系列实验,他们似乎在寻找
Accept Language
标题
>>> import urllib2
>>> opener = urllib2.build_opener()
>>> r = urllib2.Request('http://about.me/<username>')
>>> r.add_header('Accept-Language', 'en')
>>> opener.open(r)
> <addinfourl at 320988516504 whose fp = <socket._fileobject object at 0x4abc6073d0>>
导入urllib2
>>>opener=urllib2.build\u opener()
>>>r=urllib2.Request('http://about.me/')
>>>r.add_标题('Accept-Language','en')
>>>打开,打开(r)
>
谢谢!你是通过反复试验发现这一点的,还是有一种简单的方法可以让我找出网站需要什么标题?@rob.z我刚刚检查了我的浏览器发送的标题(起初我想欺骗
用户代理,但事实并非如此),留下了看起来最相关的标题,最后盲目地猜到了一个。curl-s“http://about.me/“-H”用户代理:Mozilla/5.0
适合我