从java中的xml链接提取URL位置_Java_Xml_Sitemap

从java中的xml链接提取URL位置

java xml

从java中的xml链接提取URL位置,java,xml,sitemap,Java,Xml,Sitemap,我是java新手，我有一个包含URL的链接“”，我想获取它们并将它们保存在字符串向量/数组中我先尝试了一下，看看如何获得链接 URL robotFile = new URL("https://moz.com/blog-sitemap.xml"); //read robot.txt line by line Scanner robotScanner = new Scanner(robotFile.openStream()); while (robotScanner.ha

我是java新手，我有一个包含URL的链接“”，我想获取它们并将它们保存在字符串向量/数组中

我先尝试了一下，看看如何获得链接

URL robotFile = new URL("https://moz.com/blog-sitemap.xml");

    //read robot.txt line by line
    Scanner robotScanner = new Scanner(robotFile.openStream());
    while (robotScanner.hasNextLine()) {
        System.out.println(robotScanner.nextLine());
    }

这是示例输出

我的答案是，有没有一种简单易行的方法来获取这些链接，而不是在每一行上循环检查它是否包含“https”，这样我就可以从中提取链接

您可以使用Jsoup更轻松地执行此操作：

    List<String> urlList = new ArrayList<>();
    Document doc = Jsoup.connect("https://moz.com/blog-sitemap.xml").get();
    Elements urls = doc.getElementsByTag("loc");

    for (Element url : urls) {
        urlList.add(url.text());
    }

List urlist=new ArrayList（）；
Document doc=Jsoup.connect（“https://moz.com/blog-sitemap.xml）.get（）；
元素URL=doc.getElementsByTag（“loc”）；
for（元素url:url）{
添加（url.text（））；
}

请不要将输出作为图像发布。使用纯文本代替。我认为它作为图像会更清晰，但好的@vanje是的，有一种更简单的方法：用XML解析器解析XML，并提取loc节点的文本内容。你能更清晰/详细一些吗@万杰