Java PDF包含文本,但ITextPDF看不到它

Java PDF包含文本,但ITextPDF看不到它,java,itextpdf,Java,Itextpdf,我在从PDF获取文本时遇到问题 我在5.0.6版本中使用library com.itextpdf 链接至PDF: 变量str只有特定的平方。库很可能不支持文本压缩方法。我对pdfboxIText 5.0.6也有同样的问题。当时的文本提取功能本质上只是一个概念证明。请更新到当前的5.5.x版本,然后重试。我刚刚检查了提供的示例PDF。虽然我对更新的建议仍然很好,但在这里没有帮助。PDF不包含通过PDF规范中描述的方式提取PDF文本所需的信息。一个好的第一个测试通常是尝试从AdobeReader复制

我在从PDF获取文本时遇到问题

我在5.0.6版本中使用library com.itextpdf

链接至PDF:


变量str只有特定的平方。

库很可能不支持文本压缩方法。我对pdfboxIText 5.0.6也有同样的问题。当时的文本提取功能本质上只是一个概念证明。请更新到当前的5.5.x版本,然后重试。我刚刚检查了提供的示例PDF。虽然我对更新的建议仍然很好,但在这里没有帮助。PDF不包含通过PDF规范中描述的方式提取PDF文本所需的信息。一个好的第一个测试通常是尝试从AdobeReader复制和粘贴文本,这个测试在这里也失败了。
        try {
            PdfReader reader = new PdfReader("C:\\Users\\lukas\\Desktop\\test.pdf");
            int n = reader.getNumberOfPages(); // prints 1
            String str= PdfTextExtractor.getTextFromPage(reader, 1);
            System.out.println(str);
            reader.close();
        }
        catch (Exception e) {
            System.out.println(e);
        }