Java 网络抓取器_Java - Fatal编程技术网

Java 网络抓取器

java

Java 网络抓取器,java,Java,在java中，如何下载url并将其保存到本地目录。我想要下载的url的离线视图（尤其是html内容）下面是一些将HTML吸入字符串的代码。请注意，这不会提取内容（图像等），只提取HTML！享受：）下面是一些将HTML吸收到字符串中的代码。请注意，这不会提取内容（图像等），只提取HTML！享受：）我建议在Java IO类上使用雅加达的HTTPClient，前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient，前者自动处理重定向等。您能解释一下“更多信息，我想要下载

在java中，如何下载url并将其保存到本地目录。我想要下载的url的离线视图（尤其是html内容）

下面是一些将HTML吸入字符串的代码。请注意，这不会提取内容（图像等），只提取HTML！享受：）

下面是一些将HTML吸收到字符串中的代码。请注意，这不会提取内容（图像等），只提取HTML！享受：）

我建议在Java IO类上使用雅加达的HTTPClient，前者自动处理重定向等。我建议在Java IO类上使用雅加达的HTTPClient，前者自动处理重定向等。您能解释一下“更多信息，我想要下载的url（尤其是html内容）的脱机视图。”请详细一点好吗？请你解释一下“我想要下载的url的离线视图（特别是html内容）。”请详细一点好吗？

try
{
    URL url = new URL("http://www.stackoverflow.com");
    URLConnection connection = url.openConnection();

    connection.setDoInput(true);
    InputStream inStream = connection.getInputStream();
    BufferedReader input = new BufferedReader(new InputStreamReader(inStream));

    String html = "";
    String line = "";
    while ((line = input.readLine()) != null)
    {
        html += line;
    }

    //Now you can do what you please with
    //the HTML content (save it locally, parse, etc...)
}
catch(Exception e)
{
    //Error handling
}