Java PDFBox文档到InputStream

Java PDFBox文档到InputStream,java,inputstream,pdfbox,Java,Inputstream,Pdfbox,我试图获取一个PDDocument对象,并将其作为InputStream传递给其他模块,而不将文档保存到文件系统 现在,我读到了关于PDStream的内容,并且有点理解了它的目的。因此,我试着这样做: PDStream stream = new PDStream(document); InputStream is = stream.createInputStream(); 但是,当我尝试将该输入流加载到PDDocument时,会出现以下错误: Exception in thread "mai

我试图获取一个
PDDocument
对象,并将其作为
InputStream
传递给其他模块,而不将文档保存到文件系统

现在,我读到了关于
PDStream
的内容,并且有点理解了它的目的。因此,我试着这样做:

PDStream stream = new PDStream(document);

InputStream is = stream.createInputStream();
但是,当我尝试将该输入流加载到
PDDocument
时,会出现以下错误:

Exception in thread "main" java.io.IOException: Error: End-of-File, expected line
    at org.apache.pdfbox.pdfparser.BaseParser.readLine(BaseParser.java:1111)
    at org.apache.pdfbox.pdfparser.COSParser.parseHeader(COSParser.java:1885)
    at org.apache.pdfbox.pdfparser.COSParser.parsePDFHeader(COSParser.java:1868)
    at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:245)
    at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1098)
    at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:995)
    at app.DGDCreator.main(DGDCreator.java:35)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at com.intellij.rt.execution.application.AppMain.main(AppMain.java:143)

后来我发现结果文件的大小是0kb…

我不明白您为什么要这样做,但下面的代码可以做到这一点:

public static void main(String[] args) throws IOException {
    byte[] file = FileUtils.readFileToByteArray(new File(
            "C:\\temp\\a_file.pdf"));

    PDDocument document = null;

    InputStream is = null;
    ByteArrayOutputStream out = null;

    try {
        document = PDDocument.load(file);
        out = new ByteArrayOutputStream();

        document.save(out);

        byte[] data = out.toByteArray();
        is = new ByteArrayInputStream(data);

        FileUtils.writeByteArrayToFile(new File(
                "C:\\temp\\denemeTEST123.pdf"), IOUtils.toByteArray(is));
    } finally {
        IOUtils.closeQuietly(out);
        IOUtils.closeQuietly(is);
        IOUtils.closeQuietly(document);
    }
}

所以任何其他正在搜索的人都可以找到一个很好的答案。我遇到了同样的情况,我不想把文件保存到任何机器上,只处理流本身。我找到了答案,并将在下面重复

ByteArrayOutputStream out = new ByteArrayOutputStream();
pdDoc.save(out);
pdDoc.close();
ByteArrayInputStream in = new ByteArrayInputStream(out.toByteArray());

为什么不使用
java.io.Input/OutputStream
保存(OutputStream out)
加载(InputStream in)
?因为我不想保存文档。我想将其作为数据流传递给另一个模块您想对另一个模块中的文档做什么?为什么不直接传递文档对象?为什么不保存到BufferedArrayInputStream,然后从那里创建BufferedArrayInputStream?
new PDStream(document)
不会创建包含文档的新流,而是创建要在文档中使用的新流。如果您真的想将pdf从一段代码流式传输到下一段代码,而不将其作为一个整体进行缓冲,考虑使用<代码> PodoPixPrime<代码> >代码> PiPodoOuttStudio构造。这基本上与@ AhmetRasitBekar的答案相同。我的实现不需要物理文件位置来保存文件,以便将其输入到输入流中。你的4行代码实际上是他的代码的一个子集,它们或多或少也代表了他的解决方案的核心,他的其余代码可能会在那里演示其用法。您可能会说您隔离了基本代码,但仅此而已。哦,是的,没错。我想我错过了。感谢您指出这一点。@rhavelka好的,Eric的回答显然有其优点,特别是它集中于实际问题……一个用例是将文档写入HTTP连接。大多数服务器框架,如Spring,都期望输入流。但是,PDFBox仅将字节写入OutputStream。因此,您必须写入OutputStream,然后将其读回InputStream。