Java 如何在div的losts级别获取image.src标记
我将Jsoup.connect(url.get()调用为http文档。我也调用doc.select(“img[src]”),但它返回空。现在我发现了问题所在。因为有些div标签不是静态的,而是动态生成的。当一些ajax帖子完成时。div tags标记已写入正文。在“doc=Jsoup.connect(url.get()”之后的文档中不存在以下div标记 它对我有用Java 如何在div的losts级别获取image.src标记,java,html,jsoup,Java,Html,Jsoup,我将Jsoup.connect(url.get()调用为http文档。我也调用doc.select(“img[src]”),但它返回空。现在我发现了问题所在。因为有些div标签不是静态的,而是动态生成的。当一些ajax帖子完成时。div tags标记已写入正文。在“doc=Jsoup.connect(url.get()”之后的文档中不存在以下div标记 它对我有用 String html = "<div class=\"w clear con-page\&quo
String html = "<div class=\"w clear con-page\">\r\n"
+ " <div class=\"article_nav\" >\r\n"
+ " <a href=\"index.html\">Home</a> > <a href=\"list.html\">car size rate </a>> \r\n"
+ " </div>\r\n"
+ " <div id=\"article_content\" class=\"article article_content\" style=\"min-height: 400px;\">\r\n"
+ " <div class=\"article_title\"> <p>ARTICLE:2021-04-09</div>\r\n"
+ " <div class=\"article_main\" align=\"center\">\r\n"
+ " <p ><img width=\"600\" title=\"1617952699745078083.jpg\" alt=\"1617952602(1).jpg\" src=\"http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg\"></p>\r\n"
+ " </div>\r\n"
+ " </div>\r\n"
+ "</div>";
Document doc = Jsoup.parse(html);
Elements es = doc.select("img[src]");
for (Element e : es)
System.out.println(e.attr("src"));
谢谢,我调用Jsoup.connect(url).get()作为http url文档。我也调用doc.select(“img[src]”),但它返回空。现在我发现了问题所在。对于某些div标记,它不是静态的,而是动态的。当一些ajax帖子完成时。div tags标记已写入正文。
div(w clear con-page)
--div(article_content)
--div(article_main)
--p
--img
String html = "<div class=\"w clear con-page\">\r\n"
+ " <div class=\"article_nav\" >\r\n"
+ " <a href=\"index.html\">Home</a> > <a href=\"list.html\">car size rate </a>> \r\n"
+ " </div>\r\n"
+ " <div id=\"article_content\" class=\"article article_content\" style=\"min-height: 400px;\">\r\n"
+ " <div class=\"article_title\"> <p>ARTICLE:2021-04-09</div>\r\n"
+ " <div class=\"article_main\" align=\"center\">\r\n"
+ " <p ><img width=\"600\" title=\"1617952699745078083.jpg\" alt=\"1617952602(1).jpg\" src=\"http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg\"></p>\r\n"
+ " </div>\r\n"
+ " </div>\r\n"
+ "</div>";
Document doc = Jsoup.parse(html);
Elements es = doc.select("img[src]");
for (Element e : es)
System.out.println(e.attr("src"));
http://www.chinaisa.org.cn/gxportalFile/image/2021/04/09/1617952699745078083.jpg