Java 使用JSOUP通过URL解析整个html(平均大小为20MB)

Java 使用JSOUP通过URL解析整个html(平均大小为20MB),java,jsoup,html-parsing,html-parser,Java,Jsoup,Html Parsing,Html Parser,上面的代码没有给出完整的html。如果您想要完整页面的html代码 然后使用: Document document = Jsoup.connect("some html url").get(); Elements catelist= document.select("TEXT"); document.html(); 如果您想要特定标记的html代码 然后使用: Document document = Jsoup.connect("some html url").get(); Element

上面的代码没有给出完整的html。

如果您想要完整页面的html代码 然后使用:

Document document = Jsoup.connect("some html url").get();
Elements catelist=  document.select("TEXT");
document.html();
如果您想要特定标记的html代码 然后使用:

Document document = Jsoup.connect("some html url").get();
Elements catelist=  document.select("TEXT");
document.html();

如果你想要整页的html代码 然后使用:

Document document = Jsoup.connect("some html url").get();
Elements catelist=  document.select("TEXT");
document.html();
如果您想要特定标记的html代码 然后使用:

Document document = Jsoup.connect("some html url").get();
Elements catelist=  document.select("TEXT");
document.html();

默认情况下,最大主体大小限制为1MB。您可以使用
maxBodySize(int)
更改该默认值:


默认情况下,最大主体大小限制为1MB。您可以使用
maxBodySize(int)
更改该默认值:


这里有一个猜测。解析器花费的时间太长,而您从中获取的服务器正在超时响应传输。尝试下载到一个本地文件,然后对其进行解析。解析器花费的时间太长,而您从中获取的服务器正在超时响应传输。尝试下载到本地文件,然后对其进行解析。