Java 如何获取URL中的所有链接(<;a href>;)

Java 如何获取URL中的所有链接(<;a href>;),java,Java,我得到了一些URL,我需要搜索这个URL中的所有链接,并显示它们,仅此而已 我用java编写它: PrintWriter writer=new PrintWriter("Web.txt"); URL oracle = new URL("http://edition.cnn.com/"); BufferedReader in = new BufferedReader( new InputStreamReader(oracle.ope

我得到了一些URL,我需要搜索这个URL中的所有链接,并显示它们,仅此而已

我用java编写它:

        PrintWriter writer=new PrintWriter("Web.txt");

        URL oracle = new URL("http://edition.cnn.com/");
        BufferedReader in = new BufferedReader(
        new InputStreamReader(oracle.openStream()));

        String inputLine;
        while ((inputLine = in.readLine()) != null)
        {

            writer.println(inputLine);
            System.out.println(inputLine);
        }
        in.close();
现在我的问题是如何在这个巨大的文件中只找到链接

我想,
是一条路要走!它是一个JavaAPI,您可以在其上解析HTML文档(本地或外部文档),并使用类似jQuery的语法在其DOM结构上导航

获取所有链接的代码应如下所示:

Document doc = Jsoup.connect("http://edition.cnn.com").get(); // Parse this URL's HTML
Elements elements = doc.select("a"); // Search for all <a> elements

为什么不呢?还有什么其他链接?这可能会有帮助。阅读有关正则表达式的内容:您能详细解释一下JSOUP吗?它是外部的吗?我需要将它安装到eclipse?添加了一点说明。基本上,它将这个外部URL解析为一个文档对象,并让您导航到它的DOM结构中。您只需将这个API添加到应用程序类路径中,无需安装任何东西。
for (Element element : elements) {
    writer.println(element.attr("href")); // Get the "href" attribute from the element
}