HTTP1.1协议多语言

HTTP1.1协议多语言,http,protocols,Http,Protocols,我在一个爬虫程序中工作,我想知道这个页面是否接受多种语言。 我的要求如下: GET www.stackoverflow.com HTTP/1.1 Host: www.stackoverflow.com Accept-Language: en 我如何知道他们是否接受一种以上的语言?在标题中? 内容语言只指定一个 这是一个示例标题,而不是stackoverflow答案 HTTP/1.1·200·OK Date:·Sat,·06·Set·2014·15:52:50·GMT Server:·Apache

我在一个爬虫程序中工作,我想知道这个页面是否接受多种语言。 我的要求如下:

GET www.stackoverflow.com HTTP/1.1 Host: www.stackoverflow.com Accept-Language: en 我如何知道他们是否接受一种以上的语言?在标题中? 内容语言只指定一个

这是一个示例标题,而不是stackoverflow答案

HTTP/1.1·200·OK Date:·Sat,·06·Set·2014·15:52:50·GMT Server:·Apache/2 Content-Location:·qa-http-and-lang.en.php Vary:·negotiate,accept-language,Accept-Encoding TCN:·choice P3P:·policyref="http://www.w3.org/2001/05/P3P/p3p.xml" Connection:·close Transfer-Encoding:·chunked Content-Type:·text/html; charset=utf-8 Content-Language:·en
首先,您不必设置Accept Language属性。您只需解析HTTP响应并获取内容语言。它应该具有内容所使用的所有语言的值。如果未指定内容语言,则默认情况下,该内容适用于所有语言受众。这可能意味着发送者不认为它对任何自然语言是特定的,或者发送者不知道它打算使用哪种语言。

这样,如果指定了内容语言并具有超过1的值,那么该页接受多语言,如果没有指定内容语言,您应该决定是否认为它接受多种语言。 参考:

希望能有帮助