Java 提取链接的子元素
如何提取该新闻的“阅读更多”部分。当我使用jsoup时,它只在“阅读更多”部分的内容之前给出。我想提取该新闻的全部内容Java 提取链接的子元素,java,jsoup,Java,Jsoup,如何提取该新闻的“阅读更多”部分。当我使用jsoup时,它只在“阅读更多”部分的内容之前给出。我想提取该新闻的全部内容 Scanner sc=new Scanner(System.in); String code=sc.nextLine(); doc = Jsoup.connect("http://ieee-link.org/category/events/" +code+ "/").get(); Elements els = doc.select("div.entry"); System.ou
Scanner sc=new Scanner(System.in);
String code=sc.nextLine();
doc = Jsoup.connect("http://ieee-link.org/category/events/" +code+ "/").get();
Elements els = doc.select("div.entry");
System.out.println(els.text());
阅读更多似乎包含一个链接。您可以提取该链接的目标,并使用Jsoup获取此URL:
Elements els = doc.select("div.entry");
//inside each els we can find something like: <a class="more-link" href="http://ieee-link.org/renesas/">Read More »</a>
for (Element el : els){
Element anchor = el.select("a.more-link");
if (anchor != null){
Document moreDoc = Jsoup.connect(anchor.attr("href")).get();
System.out.println(moreDoc);
}
else{
System.out.println(el);
}
}
Elements els=doc.select(“div.entry”);
//在每个els中,我们可以找到如下内容:
对于(元素el:els){
元素锚定=el.select(“a.more-link”);
if(锚点!=null){
Document moreDoc=Jsoup.connect(anchor.attr(“href”).get();
系统输出打印项次(moreDoc);
}
否则{
系统输出打印项次(el);
}
}
注意,这段代码是我头脑中写出来的。某些方法名称可能错误。拼写也有问题