解析html(可能格式不正确),而不下载Java中的全部内容

解析html(可能格式不正确),而不下载Java中的全部内容,java,html,Java,Html,我正在寻找一种从InputStream读取和解析部分html文件的方法。 假设输入如下: <html> <head> <meta something="something"> 理想的解决方案是在看到该标记后,将其存储在某个位置并关闭连接。在这种情况下,HTML可能格式不好(因为我们只得到了部分),因此xml解析器可能会失败。有办法吗?您可以使用 String partialHtml=”“; documentdocument=Jso

我正在寻找一种从
InputStream
读取和解析部分html文件的方法。 假设输入如下:

<html>
    <head>
        <meta something="something">

理想的解决方案是在看到该标记后,将其存储在某个位置并关闭连接。在这种情况下,HTML可能格式不好(因为我们只得到了部分),因此xml解析器可能会失败。有办法吗?

您可以使用

String partialHtml=”“;
documentdocument=Jsoup.parse(partialHtml);
元素值=document.getElementsByAttribute(“某物”);
用于(元素el:值){
System.out.println(el.attr(“某物”);
}

好吧,不是真的,使用这种方法,您必须下载块并在每次我似乎可以使用缓冲读取器读取内容时进行解析。谢谢
String partialHtml = "<html><head><meta something=\"something\">";
Document document = Jsoup.parse(partialHtml);
Elements values = document.getElementsByAttribute("something");
for (Element el : values) {
    System.out.println(el.attr("something"));
}