Java 如何捕获HTML页面标题之间的内容?

Java 如何捕获HTML页面标题之间的内容?,java,android,http,httpurlconnection,Java,Android,Http,Httpurlconnection,我看到一些奇怪的东西,但对专家来说可能是正常的。解释它的唯一方法就是报告我的观察结果 Wireshark用于捕获服务器对CGI命令(本质上是HTTP GET命令)的响应,如下所示: HTTP/1.1 200 OK Content-Type: text/html Content-Length: 35 Date: Thu, 19 Jan 2017 04:38:07 GMT Server: lighttpd/1.4.20 admin, Administrator user1, Group1 Con

我看到一些奇怪的东西,但对专家来说可能是正常的。解释它的唯一方法就是报告我的观察结果

Wireshark用于捕获服务器对CGI命令(本质上是HTTP GET命令)的响应,如下所示:

HTTP/1.1 200 OK
Content-Type: text/html
Content-Length: 35
Date: Thu, 19 Jan 2017 04:38:07 GMT
Server: lighttpd/1.4.20

admin, Administrator
user1, Group1

Content-Type:text/html;charset=UTF-8

<html>
<head>
<TITLE></TITLE>
</head>
<body>
request invalid html file.</body>
</html>
admin, Administrator user1, Group1 
这对我来说就像魔术。我不知道Chrome如何忽略HTML内容“请求无效HTML文件”,并显示嵌入在标题中的所需内容

Android应用程序的Java代码从相同的CGI HttpURLConnection获取以下内容:

<html>
<head>
<TITLE></TITLE>
</head>
<body>
request invalid html file.</body>
</html>

它在
服务器:lighttpd/1.4.20
行之后的两个换行符后面使用了35个字节(来自
内容长度:
),这是否意味着Java的HttpURLConnection不能正确处理它?我将编辑问题以添加Java代码。如果您看到
位,则看起来您正在通过HTTP连接传输第二个文档。响应来自一个GET命令。我没有发布从Chrome或应用程序发送的GET命令部分。请在网络视图中尝试。浏览器被设计成以多种方式处理糟糕的HTML。
BufferedReader br = new BufferedReader(new InputStreamReader(httpURLConnection.getInputStream()));
String line;
StringBuilder sbResponse = new StringBuilder();
// read from the urlconnection via the bufferedreader
while ((line = br.readLine()) != null) {
    sbResponse.append(line + System.getProperty("line.separator"));
}
br.close();