Java 解析html以检索不带标记的数据_Java_Jsoup

Java 解析html以检索不带标记的数据

java

Java 解析html以检索不带标记的数据,java,jsoup,Java,Jsoup,我有如下所示的html；我想使用JSOUP检索文本1和文本2 <html> <title>TITLE</title> <body> <h3>Subheading 1 </h3> TEXT 1 <h3> Subheading 2</h3> TEXT 2 </body> <

我有如下所示的html；我想使用

JSOUP

检索

文本1和文本2

<html>
    <title>TITLE</title>
    <body>
         <h3>Subheading 1 </h3>
              TEXT 1
         <h3> Subheading 2</h3>
              TEXT 2
    </body>
</html>


标题
第1子目
文本1
第2子目
文本2

我真的不知道如何调用它，因为它没有标记或id。请帮助。

我从来没有使用过JSOUP，但从文档（）的简要介绍来看，您应该能够使用标准javascript方法导航，这样做类似

Document doc = Jsoup.connect("http://example.com/").get();
Elements headings = doc.getElementsByTag("h3");
for (Element heading : headings) {
   Element text=heading.nextElementSibling();
   String value=text.text();
}

然后，值应该具有您想要的内容。注意：这没有经过测试，只是基于文档