Java 如何捕获HTML页面标题之间的内容？_Java_Android_Http_Httpurlconnection

Java 如何捕获HTML页面标题之间的内容？

java android http

Java 如何捕获HTML页面标题之间的内容？,java,android,http,httpurlconnection,Java,Android,Http,Httpurlconnection,我看到一些奇怪的东西，但对专家来说可能是正常的。解释它的唯一方法就是报告我的观察结果 Wireshark用于捕获服务器对CGI命令（本质上是HTTP GET命令）的响应，如下所示： HTTP/1.1 200 OK Content-Type: text/html Content-Length: 35 Date: Thu, 19 Jan 2017 04:38:07 GMT Server: lighttpd/1.4.20 admin, Administrator user1, Group1 Con

我看到一些奇怪的东西，但对专家来说可能是正常的。解释它的唯一方法就是报告我的观察结果

Wireshark用于捕获服务器对CGI命令（本质上是HTTP GET命令）的响应，如下所示：

HTTP/1.1 200 OK
Content-Type: text/html
Content-Length: 35
Date: Thu, 19 Jan 2017 04:38:07 GMT
Server: lighttpd/1.4.20

admin, Administrator
user1, Group1

Content-Type:text/html;charset=UTF-8

<html>
<head>
<TITLE></TITLE>
</head>
<body>
request invalid html file.</body>
</html>

admin, Administrator user1, Group1

这对我来说就像魔术。我不知道Chrome如何忽略HTML内容“请求无效HTML文件”，并显示嵌入在标题中的所需内容

Android应用程序的Java代码从相同的CGI HttpURLConnection获取以下内容：

<html>
<head>
<TITLE></TITLE>
</head>
<body>
request invalid html file.</body>
</html>

它在

服务器：lighttpd/1.4.20

行之后的两个换行符后面使用了35个字节（来自

内容长度：

），这是否意味着Java的HttpURLConnection不能正确处理它？我将编辑问题以添加Java代码。如果您看到

位，则看起来您正在通过HTTP连接传输第二个文档。响应来自一个GET命令。我没有发布从Chrome或应用程序发送的GET命令部分。请在网络视图中尝试。浏览器被设计成以多种方式处理糟糕的HTML。

BufferedReader br = new BufferedReader(new InputStreamReader(httpURLConnection.getInputStream()));
String line;
StringBuilder sbResponse = new StringBuilder();
// read from the urlconnection via the bufferedreader
while ((line = br.readLine()) != null) {
    sbResponse.append(line + System.getProperty("line.separator"));
}
br.close();