Java 网络抓取器

Java 网络抓取器,java,Java,在java中,如何下载url并将其保存到本地目录。我想要下载的url的离线视图(尤其是html内容) 下面是一些将HTML吸入字符串的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:) 下面是一些将HTML吸收到字符串中的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:) 我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。您能解释一下“更多信息,我想要下载

在java中,如何下载url并将其保存到本地目录。我想要下载的url的离线视图(尤其是html内容)

下面是一些将HTML吸入字符串的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:)


下面是一些将HTML吸收到字符串中的代码。请注意,这不会提取内容(图像等),只提取HTML!享受:)


我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient,前者自动处理重定向等。您能解释一下“更多信息,我想要下载的url(尤其是html内容)的脱机视图。”请详细一点好吗?请你解释一下“我想要下载的url的离线视图(特别是html内容)。”请详细一点好吗?
try
{
    URL url = new URL("http://www.stackoverflow.com");
    URLConnection connection = url.openConnection();

    connection.setDoInput(true);
    InputStream inStream = connection.getInputStream();
    BufferedReader input = new BufferedReader(new InputStreamReader(inStream));

    String html = "";
    String line = "";
    while ((line = input.readLine()) != null)
    {
        html += line;
    }

    //Now you can do what you please with
    //the HTML content (save it locally, parse, etc...)
}
catch(Exception e)
{
    //Error handling
}