Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/337.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用PDFBox 2.0.2从PDF中提取文本缺少类PDFTextStripper()_Java_Pdf_Pdfbox_Text Extraction - Fatal编程技术网

Java 使用PDFBox 2.0.2从PDF中提取文本缺少类PDFTextStripper()

Java 使用PDFBox 2.0.2从PDF中提取文本缺少类PDFTextStripper(),java,pdf,pdfbox,text-extraction,Java,Pdf,Pdfbox,Text Extraction,我已经用java中的PDFBOX1.8.10实现了简单的文本提取方法。由于某些原因,我必须将库升级到PDFBox 2.0.2。可能已删除或找到新版本中的另一个包的PDFTextStripper()方法。有办法解决这个问题吗?或者你能建议另一种从PDF获取文本的方法吗 这是我的密码: public String extractTextFromPdf() { File jInputFile = new File("c:/lorem/ipsum.pdf"); PDDocument

我已经用java中的PDFBOX1.8.10实现了简单的文本提取方法。由于某些原因,我必须将库升级到PDFBox 2.0.2。可能已删除或找到新版本中的另一个包的PDFTextStripper()方法。有办法解决这个问题吗?或者你能建议另一种从PDF获取文本的方法吗

这是我的密码:

public String extractTextFromPdf() {
     File jInputFile = new File("c:/lorem/ipsum.pdf");
     PDDocument PDDoc = PDDocument.load(jInputFile ); 
     String strContent = new PDFTextStripper().getText(PDDoc);
     PDDoc.close();
     return strContent;
}
提前谢谢。

试试这个

{
    PDDocument document = null;
    document = PDDocument.load(new File("test.pdf"));
    document.getClass();
    if (!document.isEncrypted()) {
        PDFTextStripperByArea stripper = new PDFTextStripperByArea();
        stripper.setSortByPosition(true);
        PDFTextStripper Tstripper = new PDFTextStripper();
        String st = Tstripper.getText(document);
        System.out.println("Text:" + st);
    }
} catch (Exception e) {
    e.printStackTrace();
}`

你用的是什么IDE?在Netbeans中,按Ctrl-Shift-I,导入将自动修复。在eclipse中,按Ctrl-Shift-O。@Tilmanhausher谢谢你。我正在使用eclipse。重新启动后,它已被修复。我认为这是暂时的错误。PDFBox将PDFTextStripper类从“org.apache.PDFBox.util”移动到“org.apache.PDFBox.text”包。多好的发展…很高兴它能起作用。请删除您的问题,因为这是一个相当琐碎的问题。或者自己回答。这不是问题的答案。另外,
document.getClass()无效<代码>如果不需要(!document.isEncrypted())