从java中的xml链接提取URL位置
我是java新手,我有一个包含URL的链接“”,我想获取它们并将它们保存在字符串向量/数组中 我先尝试了一下,看看如何获得链接从java中的xml链接提取URL位置,java,xml,sitemap,Java,Xml,Sitemap,我是java新手,我有一个包含URL的链接“”,我想获取它们并将它们保存在字符串向量/数组中 我先尝试了一下,看看如何获得链接 URL robotFile = new URL("https://moz.com/blog-sitemap.xml"); //read robot.txt line by line Scanner robotScanner = new Scanner(robotFile.openStream()); while (robotScanner.ha
URL robotFile = new URL("https://moz.com/blog-sitemap.xml");
//read robot.txt line by line
Scanner robotScanner = new Scanner(robotFile.openStream());
while (robotScanner.hasNextLine()) {
System.out.println(robotScanner.nextLine());
}
这是示例输出
我的答案是,有没有一种简单易行的方法来获取这些链接,而不是在每一行上循环检查它是否包含“https”,这样我就可以从中提取链接 您可以使用Jsoup更轻松地执行此操作:
List<String> urlList = new ArrayList<>();
Document doc = Jsoup.connect("https://moz.com/blog-sitemap.xml").get();
Elements urls = doc.getElementsByTag("loc");
for (Element url : urls) {
urlList.add(url.text());
}
List urlist=new ArrayList();
Document doc=Jsoup.connect(“https://moz.com/blog-sitemap.xml).get();
元素URL=doc.getElementsByTag(“loc”);
for(元素url:url){
添加(url.text());
}
请不要将输出作为图像发布。使用纯文本代替。我认为它作为图像会更清晰,但好的@vanje是的,有一种更简单的方法:用XML解析器解析XML,并提取loc节点的文本内容。你能更清晰/详细一些吗@万杰