Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/391.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后_Java_Web Scraping_Jsoup - Fatal编程技术网

Java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后

Java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,我正试图通过Java中的jsoup解析过去3天中的某些信息-\这是我的代码: Document document = Jsoup.connect(urlofpage).get(); Elements links = document.select(".contentBox"); for (Element link : links) { // String name = link.text(); String title = link.select("h2

我正试图通过Java中的jsoup解析过去3天中的某些信息-\这是我的代码:

Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");

    for (Element link : links) {
        // String name = link.text();
        String title = link.select("h2").text();
        String content = link.select("p").text();
        System.out.println(title);
        System.out.println(content);
    }
它按照指示提取数据,提取h2和p的数据,但问题是,我想解析
标记中的数据,该标记紧跟在每个
标记之后

例如(HTML内容):

有什么解决办法吗

您可以使用“~”下一个元素选择器。比如说

link.select("h2 ~ p").get(0).text(); // returns "content"
link.select("h2 ~ p").get(1).text(); // returns "new content od 2"
您可以使用“~”下一个元素选择器。比如说

link.select("h2 ~ p").get(0).text(); // returns "content"
link.select("h2 ~ p").get(1).text(); // returns "new content od 2"

只需使用初始方法在选定的
类中迭代所有必要的标记即可。contentBox
类:

Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");

       for (Element link : links) {
            for (Element h2Tag : link.select("h2"))
            {
               System.out.println(h2Tag.text());
            }
            for (Element pTag : link.select("p"))
            {
               System.out.println(pTag.text());
            }
         }

只需使用初始方法在选定的
类中迭代所有必要的标记即可。contentBox
类:

Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");

       for (Element link : links) {
            for (Element h2Tag : link.select("h2"))
            {
               System.out.println(h2Tag.text());
            }
            for (Element pTag : link.select("p"))
            {
               System.out.println(pTag.text());
            }
         }

不,这不是我想要的,例如查看我提供的url不,这不是我想要的,例如查看我提供的url