Java 解析html以检索不带标记的数据
我有如下所示的html;我想使用Java 解析html以检索不带标记的数据,java,jsoup,Java,Jsoup,我有如下所示的html;我想使用JSOUP检索文本1和文本2 <html> <title>TITLE</title> <body> <h3>Subheading 1 </h3> TEXT 1 <h3> Subheading 2</h3> TEXT 2 </body> <
JSOUP
检索文本1和文本2
<html>
<title>TITLE</title>
<body>
<h3>Subheading 1 </h3>
TEXT 1
<h3> Subheading 2</h3>
TEXT 2
</body>
</html>
标题
第1子目
文本1
第2子目
文本2
我真的不知道如何调用它,因为它没有标记或id。请帮助。我从来没有使用过JSOUP,但从文档()的简要介绍来看,您应该能够使用标准javascript方法导航,这样做类似
Document doc = Jsoup.connect("http://example.com/").get();
Elements headings = doc.getElementsByTag("h3");
for (Element heading : headings) {
Element text=heading.nextElementSibling();
String value=text.text();
}
然后,值应该具有您想要的内容。注意:这没有经过测试,只是基于文档