对HttpClient[Java]处理gzip响应有点困惑

对HttpClient[Java]处理gzip响应有点困惑,java,gzip,apache-httpclient-4.x,http-get,Java,Gzip,Apache Httpclient 4.x,Http Get,我的应用程序向某个api服务发出http请求,该服务返回Gzip响应。如何确保响应确实是gzip格式的?我很困惑,为什么在提出请求后我不必解压缩它 下面是我的代码: public static String streamToString(InputStream stream) { BufferedReader reader = new BufferedReader(new InputStreamReader(stream)); StringBuilder sb = new Str

我的应用程序向某个api服务发出http请求,该服务返回Gzip响应。如何确保响应确实是gzip格式的?我很困惑,为什么在提出请求后我不必解压缩它

下面是我的代码:

public static String streamToString(InputStream stream) {
    BufferedReader reader = new BufferedReader(new InputStreamReader(stream));
    StringBuilder sb = new StringBuilder();
    String line;

    try {
        while ((line = reader.readLine()) != null) {
            sb.append(line).append("\n");
        }
    } catch (IOException e) {
        logger.error("Error while streaming to string: {}", e);
    } finally {
        try { stream.close(); } catch (IOException e) { }
    }

    return sb.toString();
}

public static String getResultFromHttpRequest(String url) throws IOException { // add retries, catch all exceptions
    HttpClient httpclient = new DefaultHttpClient();
    HttpGet httpGet;
    HttpResponse httpResponse;
    InputStream stream;

    try {
        httpGet = new HttpGet(url);
        httpGet.setHeader("Content-Encoding", "gzip, deflate");
        httpResponse = httpclient.execute(httpGet);
        logger.info(httpResponse.getEntity().getContentEncoding());
        logger.info(httpResponse.getEntity().getContent());
        if (httpResponse.getStatusLine().getStatusCode() == 200) {
            stream = httpResponse.getEntity().getContent();
            return streamToString(stream);
        }
    } catch (IllegalStateException e) {
        logger.error("Error while trying to access: " + url, e);
    }

    return "";
}
也许它是自动解压缩的,但我想至少看到一些迹象。

我想您应该使用(或者新的-默认情况下添加了该标题,不要调用disableContentCompression-我认为默认情况下,
DefaultHttpClient
不支持压缩)。客户端需要发送一个头,内容编码来自服务器响应

httpResponse.getEntity().getContentEncoding()

您可以通过检查实体的
内容编码
头来确定实体是否需要解压缩。在自动内容解压缩的情况下,此标题将被重写(或删除)。

嗨,我迟到了,但这个答案可能会被面临相同问题的人使用。 默认情况下,内容在响应中解压缩。因此,必须使用以下代码禁用默认压缩:

CloseableHttpClient client = HttpClients.custom()
    .disableContentCompression()
    .build();

HttpGet request = new HttpGet(urlSring);
request.setHeader(HttpHeaders.ACCEPT_ENCODING, "gzip");

CloseableHttpResponse response = client.execute(request, context);
HttpEntity entity = response.getEntity();
Header contentEncodingHeader = entity.getContentEncoding();

if (contentEncodingHeader != null) {
    HeaderElement[] encodings =contentEncodingHeader.getElements();
    for (int i = 0; i < encodings.length; i++) {
        if (encodings[i].getName().equalsIgnoreCase("gzip")) {
            entity = new GzipDecompressingEntity(entity);
            break;
        }
    }
}

String output = EntityUtils.toString(entity, Charset.forName("UTF-8").name());
CloseableHttpClient=HttpClients.custom()
.disableContentCompression()
.build();
HttpGet请求=新的HttpGet(urlSring);
setHeader(HttpHeaders.ACCEPT_编码,“gzip”);
CloseableHttpResponse response=client.execute(请求、上下文);
HttpEntity=response.getEntity();
Header contentEncodingHeader=entity.getContentEncoding();
if(contentEncodingHeader!=null){
HeaderElement[]编码=contentEncodingHeader.getElements();
for(int i=0;i
自4.1以来,Apache HttpClient处理请求和响应压缩。你可以在另一个答案中检查这个例子

仍然是为了检查响应是否被压缩。您可以打印实体的类

HttpResponse httpResponse = client.execute(request);
HttpEntity httpEntity = httpResponse.getEntity();
System.out.println(httpEntity.getClass().getName());

gzip
的情况下,输出将是
org.apache.http.client.entity.gzip decompressionEntity
&对于
deflate
its
org.apache.http.client.entity.decompressionEntity
,它的
org.apache.http.client.entity.decompressionEntity

可能与@jtahlborn类似,但不完全相同。如果环境允许这样做,非常快速的检查可以捕获应用程序和服务器之间的流量(Wireshark、Tcpdump…)。由于HTTP是一种基于文本的协议,如果响应具有正确的头,并且主体主要由不可读的字符组成,则响应看起来是压缩的。@yaoyang它经常更改!我添加了HttpClientBuilder,这似乎是更现代的方法。@yaojiang:HttpClientBuilder不受欢迎。我会看一看。当我得到响应时,我为contentencoding做了一个sysout,但它显示为空字符串,这是否意味着它是自动的?@yaojiang:没有显式的“Content Encoding”头意味着身份编码,也就是说,没有编码当我在firefox上输入api url时,我确实看到响应头包含“Content Encoding=gzip”、“Content length=278”、“Content type=application/json,charset=utf-8”、“vary=Accept Encoding”@姚江:那又怎样?您可以禁用自动内容解压缩或在有线登录时执行以查看原始HTTP消息composition@oleg那又怎样?他的意思是,响应包含一个设置为gzip的内容编码,但http响应对象不显示它。我也遇到了这个问题。