无法使用org.apache.commons.io java库下载pdf Web链接_Java_Apache_File Io_Download_Pdf Generation

无法使用org.apache.commons.io java库下载pdf Web链接

java apache file-io download

无法使用org.apache.commons.io java库下载pdf Web链接,java,apache,file-io,download,pdf-generation,Java,Apache,File Io,Download,Pdf Generation,我正在尝试使用org.apache.commons.io java库下载PDF Web链接。我想下载“”intp pdf文件，当我运行以下java类时，它会在我的磁盘上创建目标pdf，但我无法打开或读取该pdf。它抛出一个错误文件已损坏或无法读取如果有人能检查我代码中的错误以及如何将pdf网页链接下载到pdf文件中，我将不胜感激 import java.io.File; import java.io.IOException; import java.net.URL; import org.

我正在尝试使用org.apache.commons.io java库下载PDF Web链接。我想下载“”intp pdf文件，当我运行以下java类时，它会在我的磁盘上创建目标pdf，但我无法打开或读取该pdf。它抛出一个错误文件已损坏或无法读取

如果有人能检查我代码中的错误以及如何将pdf网页链接下载到pdf文件中，我将不胜感激

import java.io.File;
import java.io.IOException;
import java.net.URL;

import org.apache.commons.io.FileUtils;

public class Simple {
    public static void main(String[] args) {
        try {
            URL url = new URL("https://docs.google.com/**********.pdf");
            File destination = new File("kodejava.html");

            //
            // Copy bytes from the URL to the destination file.
            //
            FileUtils.copyURLToFile(url, destination);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

您需要将文件另存为pdf，而不是html。请尝试将下载的文件重命名为kodejava.pdf并打开。我可以将其下载为.pdf并打开。

为什么要将.pdf文件保存为.html文件？是否检查了文件内容？如果目标文件id为pdf，它创建但我无法打开它抛出错误损坏的文件。我更改为“kodejava.pdf”，但创建的pdf无法打开它抛出错误损坏的文件我尝试了此网站-。成功了。可能是您没有权限它工作了，因为它以www开头，以https://doesnt开头的站点不工作。您是否能够在浏览器中打开它而无需验证？它在broswer中打开，但为空白黑色页面。