Java 如何强制Jsoup在特定行之后开始解析,从而忽略冗余信息?

Java 如何强制Jsoup在特定行之后开始解析,从而忽略冗余信息?,java,parsing,html-parsing,jsoup,Java,Parsing,Html Parsing,Jsoup,我使用Jsoup解析HTML页面,所有这些页面都具有相同的结构,并且在页面的开头包含冗余信息,比如HTML文档的前2000行。有没有办法强制Jsoup it在特定行之后开始解析?这会对我的代码速度产生重大影响吗?Jsoup使用解析树,但它的目的是非常有弹性。也许您可以尝试手动删除前2000行,然后在其余节点上运行Jsoup,看看它是否能够生成合理的解析树。我不知道这种优化是否会带来很大的不同;Jsoup已经快得离谱了。

我使用Jsoup解析HTML页面,所有这些页面都具有相同的结构,并且在页面的开头包含冗余信息,比如HTML文档的前2000行。有没有办法强制Jsoup it在特定行之后开始解析?这会对我的代码速度产生重大影响吗?

Jsoup使用解析树,但它的目的是非常有弹性。也许您可以尝试手动删除前2000行,然后在其余节点上运行Jsoup,看看它是否能够生成合理的解析树。我不知道这种优化是否会带来很大的不同;Jsoup已经快得离谱了。