Java 提取链接的子元素

Java 提取链接的子元素,java,jsoup,Java,Jsoup,如何提取该新闻的“阅读更多”部分。当我使用jsoup时,它只在“阅读更多”部分的内容之前给出。我想提取该新闻的全部内容 Scanner sc=new Scanner(System.in); String code=sc.nextLine(); doc = Jsoup.connect("http://ieee-link.org/category/events/" +code+ "/").get(); Elements els = doc.select("div.entry"); System.ou

如何提取该新闻的“阅读更多”部分。当我使用jsoup时,它只在“阅读更多”部分的内容之前给出。我想提取该新闻的全部内容

Scanner sc=new Scanner(System.in);
String code=sc.nextLine();
doc = Jsoup.connect("http://ieee-link.org/category/events/" +code+ "/").get();
Elements els = doc.select("div.entry");
System.out.println(els.text());  

阅读更多似乎包含一个链接。您可以提取该链接的目标,并使用Jsoup获取此URL:

Elements els = doc.select("div.entry");
//inside each els we can find something like: <a class="more-link" href="http://ieee-link.org/renesas/">Read More »</a>

for (Element el : els){
  Element anchor = el.select("a.more-link");
  if (anchor != null){
    Document moreDoc = Jsoup.connect(anchor.attr("href")).get();
    System.out.println(moreDoc);
  }
  else{
    System.out.println(el);
  }
}
Elements els=doc.select(“div.entry”);
//在每个els中,我们可以找到如下内容:
对于(元素el:els){
元素锚定=el.select(“a.more-link”);
if(锚点!=null){
Document moreDoc=Jsoup.connect(anchor.attr(“href”).get();
系统输出打印项次(moreDoc);
}
否则{
系统输出打印项次(el);
}
}
注意,这段代码是我头脑中写出来的。某些方法名称可能错误。拼写也有问题