从java中的xml链接提取URL位置

从java中的xml链接提取URL位置,java,xml,sitemap,Java,Xml,Sitemap,我是java新手,我有一个包含URL的链接“”,我想获取它们并将它们保存在字符串向量/数组中 我先尝试了一下,看看如何获得链接 URL robotFile = new URL("https://moz.com/blog-sitemap.xml"); //read robot.txt line by line Scanner robotScanner = new Scanner(robotFile.openStream()); while (robotScanner.ha

我是java新手,我有一个包含URL的链接“”,我想获取它们并将它们保存在字符串向量/数组中

我先尝试了一下,看看如何获得链接

URL robotFile = new URL("https://moz.com/blog-sitemap.xml");

    //read robot.txt line by line
    Scanner robotScanner = new Scanner(robotFile.openStream());
    while (robotScanner.hasNextLine()) {
        System.out.println(robotScanner.nextLine());
    }
这是示例输出


我的答案是,有没有一种简单易行的方法来获取这些链接,而不是在每一行上循环检查它是否包含“https”,这样我就可以从中提取链接

您可以使用Jsoup更轻松地执行此操作:

    List<String> urlList = new ArrayList<>();
    Document doc = Jsoup.connect("https://moz.com/blog-sitemap.xml").get();
    Elements urls = doc.getElementsByTag("loc");

    for (Element url : urls) {
        urlList.add(url.text());
    }
List urlist=new ArrayList();
Document doc=Jsoup.connect(“https://moz.com/blog-sitemap.xml).get();
元素URL=doc.getElementsByTag(“loc”);
for(元素url:url){
添加(url.text());
}

请不要将输出作为图像发布。使用纯文本代替。我认为它作为图像会更清晰,但好的@vanje是的,有一种更简单的方法:用XML解析器解析XML,并提取loc节点的文本内容。你能更清晰/详细一些吗@万杰