Java 如何解析要按父div分割的HTML字符串';s

Java 如何解析要按父div分割的HTML字符串';s,java,html,Java,Html,我有一个html字符串,如下所示: <div class="row xyz"> <!--Multiple Other div's and tags--> </div> <div class="row xws"> <!--Multiple Other div's and tags--> </div> <div class="row daze"> <!--Multip

我有一个html字符串,如下所示:

<div class="row xyz"> 

    <!--Multiple Other div's and tags-->

</div>

<div class="row xws"> 

    <!--Multiple Other div's and tags-->

</div>

<div class="row daze"> 

    <!--Multiple Other div's and tags-->

</div>

如您所见,它有3个父div

如何使用JAVA按父div的数量拆分HTML字符串,而不使用动态生成的类名“row xyz”,在本例中为3 因此,我将得到:

字符串div1

字符串div2

字符串div3

其中div1=

<div class="row xyz"> 

    <!--Multiple Other div's and tags-->

</div>

第2部分=

<div class="row xws"> 

    <!--Multiple Other div's and tags-->

</div>

第3部分=

<div class="row daze"> 

    <!--Multiple Other div's and tags-->

</div>

尝试使用以下方法:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class MyClass {
    public static void main(String args[]) {
        String html = "<html><head/><body>"+
        "<div class=\"row xyz\"> <div>div1</div> <div>div1_1</div> </div>"+
        "<div class=\"row xws\"> <div>div2</div> </div>" + 
        "<div class=\"row daze\">  <div>div3</div></div>"+
        "</body></html>";
        Document document = Jsoup.parse(html);
        Elements divs = document.select("body > div");//get first level of divs

        for (int i=0; i< divs.size(); i++) {
            System.out.println(String.format("div%d = %s", i + 1, divs.get(i).outerHtml()));
        }
    }
}
import org.jsoup.jsoup;
导入org.jsoup.nodes.Document;
导入org.jsoup.nodes.Element;
导入org.jsoup.select.Elements;
公共类MyClass{
公共静态void main(字符串参数[]){
字符串html=“”+
“div1 div1\u 1”+
“第2分部”+
“第3分部”+
"";
documentdocument=Jsoup.parse(html);
Elements divs=document.select(“body>div”);//获取第一级div
对于(int i=0;i
输出将是:

    div1 = <div class="row xyz"> 
 <div>
  div1
 </div> 
 <div>
  div1_1
 </div> 
</div>
div2 = <div class="row xws"> 
 <div>
  div2
 </div> 
</div>
div3 = <div class="row daze"> 
 <div>
  div3
 </div>
</div>
div1=
第一组
第一单元
第2部分=
第二组
第3部分=
第三组