Coldfusion CFHTTP编码问题

Coldfusion CFHTTP编码问题,coldfusion,cfhttp,Coldfusion,Cfhttp,我正在尝试使用cfhttp从中提取一个用于解析信息的页面。我调用的页面标题是: 内容编码:gzip 连接:保持活力 内容长度:19066 服务器:IBM_HTTP_服务器 更改:接受编码,用户代理 内容语言:en US 缓存控制:no Cache=“设置cookie set-cookie2“ 内容类型: text/html;字符集=ISO-8859-1 我将字符集设置为ISO-8859-1,但是我在文件内容中得到了以下内容(下面只显示了一个小示例,但我认为它是正确的) 埃涅克·奥涅·佐尔·Vú5

我正在尝试使用cfhttp从中提取一个用于解析信息的页面。我调用的页面标题是:

内容编码:gzip

连接:保持活力

内容长度:19066

服务器:IBM_HTTP_服务器

更改:接受编码,用户代理

内容语言:en US

缓存控制:no Cache=“设置cookie

set-cookie2“

内容类型:

text/html;字符集=ISO-8859-1

我将字符集设置为ISO-8859-1,但是我在文件内容中得到了以下内容(下面只显示了一个小示例,但我认为它是正确的)

埃涅克·奥涅·佐尔·Vú5ðbÿ230;¾乌赫尼科夫·乔丹 ùùùùùùùùý,uùQyk5g?uÛ3¸fãx ARÃiýRã _òCAß.
“b/”WÝWÝWÆW~,“iÜCþþÃZ5”8½ì*
ZÜjOÝK/Ë4§ÈG5×6ÚwÇ0]ã:þþG“Ál/t”

我要做的第一件事是,通过在其他页面上尝试相同的代码,确保问题不是源内容/服务器。如果它们工作正常,那么很可能是您试图使用的服务器/内容。如果它们有相同的问题,那么问题就在代码中。如果您发布代码也会很有帮助。

在标题中,您看到的是文件的gzip内容。它需要先解压缩,然后才能对您有用。我想你可以用cfzip来做这件事,但是你还没有做这件事的经验

似乎表明您可以在请求中添加一个标头,以便在返回之前将其解压缩/解压缩:

<cfhttp ...>
    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
    <cfhttpparam type="Header" name="TE" value="deflate;q=0">
</cfhttp>

cars.com的问题似乎是他们将输出压缩了两次(基于)

所以,我们需要解压缩内容。。。再次

首先,我们需要以二进制形式获取内容,因此CFHTTP调用需要包括

getasbinary="yes"
然后,我们需要解压它

我们可以使用java.util.zip来完成。gunzip是以下内容的修改版本:


#解压HTML#
函数gunzip(以字节为单位){
var gzInStream=createObject('java','java.util.zip.GZIPInputStream');
var outStream=createObject('java','java.io.ByteArrayOutputStream');
var inStream=createObject('java','java.io.ByteArrayInputStream');
var buffer=repeatString(“,1024).getBytes();
变量长度=0;
var rv=“”;
试一试{
流内初始化(以字节为单位);
gzInStream.init(inStream);
outStream.init();
做{
长度=gzInStream.read(缓冲区,01024);
如果(长度neq-1)超出流。写入(缓冲区,0,长度);
}while(长度neq-1);
rv=超出流。toString();
exptream.close();
gzInStream.close();
流内关闭();
}
捕获(任何e){
rv=“”;
试一试{
exptream.close();
}捕获(任意e){}
试一试{
gzInStream.close();
}捕获(任何e){
试一试{
流内关闭();
}捕获(任意e){}
}
}
返回rv;
}

确保再次检查函数的var范围。我可能错过了一些东西。

这似乎不是问题,这是我的第一个想法,但如果我有这个问题,我会遇到连接失败的问题。这似乎更像是一个字符集问题,但同时似乎没有任何字符集在工作。谢谢,这似乎是一个问题,我试图消费的内容,但不是在服务器上,因为我可以在任何css或js文件上使用cfhttp,但它似乎只是html页面。很高兴听到这一点!这是一个有趣的问题。
<cfhttp ...>
    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
    <cfhttpparam type="Header" name="TE" value="deflate;q=0">
</cfhttp>
getasbinary="yes"
<cfhttp
    getasbinary="yes"
    METHOD="get"
    throwonerror="yes"
    CHARSET="ISO-8859-1"
    URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10" >

    <cfhttpparam type="Header" name="Accept" value="application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5">
    <cfhttpparam type="Header" name="User-Agent" value="Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_5_8; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41">
    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate">
    <cfhttpparam type="Header" name="TE" value="deflate, chunked, identity, trailers">

</cfhttp>

<cfset unzippedHTML = gunzip(cfhttp.FileContent)>

<cfoutput>
    #unzippedHTML#
</cfoutput>

<cfscript>

    function gunzip(inBytes) {
        var gzInStream = createObject('java','java.util.zip.GZIPInputStream');
        var outStream = createObject('java','java.io.ByteArrayOutputStream');
        var inStream = createObject('java','java.io.ByteArrayInputStream');
        var buffer = repeatString(" ",1024).getBytes();
        var length = 0;
        var rv = "";

        try {
            inStream.init(inBytes);
            gzInStream.init(inStream);
            outStream.init();
            do {
                length = gzInStream.read(buffer,0,1024);
                if (length neq -1) outStream.write(buffer,0,length);
            } while (length neq -1);
            rv = outStream.toString();
            outStream.close();
            gzInStream.close();
            inStream.close();
        }
        catch (any e) {
            rv = "";
            try {
                outStream.close();
            } catch (any e) { }
                try {
                    gzInStream.close();
                } catch (any e) {
                    try {
                        inStream.close();
                    } catch (any e) {}
                }
        }
        return rv;
    }
</cfscript>