Java 使用PDFBox从特定页面读取文本

Java 使用PDFBox从特定页面读取文本,java,pdfbox,Java,Pdfbox,我知道如何使用PDFBox使用PDFTextStripper.getText(PDDocument)读取整个pdf文件的文本 我还有一个关于如何使用PDDocumentCatalog.getAllPages().get(I)获取特定页面的对象引用的示例 如何使用PDFBox获取一页的文本,因为我在PDPage类中未看到任何此类方法?您可以在上设置参数以读取特定页面: PDDocument doc; // document int i; // page no. PDFTextStripper r

我知道如何使用PDFBox使用
PDFTextStripper.getText(PDDocument)
读取整个pdf文件的文本

我还有一个关于如何使用
PDDocumentCatalog.getAllPages().get(I)
获取特定页面的对象引用的示例


如何使用PDFBox获取一页的文本,因为我在
PDPage
类中未看到任何此类方法?

您可以在上设置参数以读取特定页面:

PDDocument doc; // document
int i; // page no.

PDFTextStripper reader = new PDFTextStripper();
reader.setStartPage(i);
reader.setEndPage(i);
String pageText = reader.getText(doc);
据我所知,它更多地用于在屏幕上表示页面,而不是提取文本。因此,我不建议使用它来提取文本