Java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后
我正试图通过Java中的jsoup解析过去3天中的某些信息-\这是我的代码:Java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,我正试图通过Java中的jsoup解析过去3天中的某些信息-\这是我的代码: Document document = Jsoup.connect(urlofpage).get(); Elements links = document.select(".contentBox"); for (Element link : links) { // String name = link.text(); String title = link.select("h2
Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");
for (Element link : links) {
// String name = link.text();
String title = link.select("h2").text();
String content = link.select("p").text();
System.out.println(title);
System.out.println(content);
}
它按照指示提取数据,提取h2和p的数据,但问题是,我想解析
标记中的数据,该标记紧跟在每个
标记之后
例如(HTML内容):
有什么解决办法吗 您可以使用“~”下一个元素选择器。比如说
link.select("h2 ~ p").get(0).text(); // returns "content"
link.select("h2 ~ p").get(1).text(); // returns "new content od 2"
您可以使用“~”下一个元素选择器。比如说
link.select("h2 ~ p").get(0).text(); // returns "content"
link.select("h2 ~ p").get(1).text(); // returns "new content od 2"
只需使用初始方法在选定的
类中迭代所有必要的标记即可。contentBox
类:
Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");
for (Element link : links) {
for (Element h2Tag : link.select("h2"))
{
System.out.println(h2Tag.text());
}
for (Element pTag : link.select("p"))
{
System.out.println(pTag.text());
}
}
只需使用初始方法在选定的
类中迭代所有必要的标记即可。contentBox
类:
Document document = Jsoup.connect(urlofpage).get();
Elements links = document.select(".contentBox");
for (Element link : links) {
for (Element h2Tag : link.select("h2"))
{
System.out.println(h2Tag.text());
}
for (Element pTag : link.select("p"))
{
System.out.println(pTag.text());
}
}
不,这不是我想要的,例如查看我提供的url不,这不是我想要的,例如查看我提供的url