无法使用org.apache.commons.io java库下载pdf Web链接
我正在尝试使用org.apache.commons.io java库下载PDF Web链接。 我想下载“”intp pdf文件,当我运行以下java类时,它会在我的磁盘上创建目标pdf,但我无法打开或读取该pdf。它抛出一个错误文件已损坏或无法读取 如果有人能检查我代码中的错误以及如何将pdf网页链接下载到pdf文件中,我将不胜感激无法使用org.apache.commons.io java库下载pdf Web链接,java,apache,file-io,download,pdf-generation,Java,Apache,File Io,Download,Pdf Generation,我正在尝试使用org.apache.commons.io java库下载PDF Web链接。 我想下载“”intp pdf文件,当我运行以下java类时,它会在我的磁盘上创建目标pdf,但我无法打开或读取该pdf。它抛出一个错误文件已损坏或无法读取 如果有人能检查我代码中的错误以及如何将pdf网页链接下载到pdf文件中,我将不胜感激 import java.io.File; import java.io.IOException; import java.net.URL; import org.
import java.io.File;
import java.io.IOException;
import java.net.URL;
import org.apache.commons.io.FileUtils;
public class Simple {
public static void main(String[] args) {
try {
URL url = new URL("https://docs.google.com/**********.pdf");
File destination = new File("kodejava.html");
//
// Copy bytes from the URL to the destination file.
//
FileUtils.copyURLToFile(url, destination);
} catch (IOException e) {
e.printStackTrace();
}
}
}
您需要将文件另存为pdf,而不是html。请尝试将下载的文件重命名为kodejava.pdf并打开。我可以将其下载为.pdf并打开。为什么要将.pdf文件保存为.html文件?是否检查了文件内容?如果目标文件id为pdf,它创建但我无法打开它抛出错误损坏的文件。我更改为“kodejava.pdf”,但创建的pdf无法打开它抛出错误损坏的文件我尝试了此网站-。成功了。可能是您没有权限它工作了,因为它以www开头,以https://doesnt开头的站点不工作。您是否能够在浏览器中打开它而无需验证?它在broswer中打开,但为空白黑色页面。