如何使用任何Java库使现有PDF文本可搜索?用光学字符识别

如何使用任何Java库使现有PDF文本可搜索?用光学字符识别,java,ocr,pdfbox,Java,Ocr,Pdfbox,有java库吗? 如何使用任何java库生成可搜索文本? 开源或付费 如何使用PDFBox将OCR应用于pdf? 如何使用pdfbox以编程方式搜索pdf文本 我找了很多。没有找到任何解决办法。 任何人都可以粘贴OCR PDFBox的代码。试试 要提取文本,请执行以下操作: 有java库吗?如何使用任何java库生成可搜索文本?开源或付费 您可以使用Gnostice XtremeDocumentStudio for Java实现这一点。有关更多详细信息,请点击下面的链接 仅供参考,在本文中,我们

有java库吗? 如何使用任何java库生成可搜索文本? 开源或付费

如何使用PDFBox将OCR应用于pdf?
如何使用pdfbox以编程方式搜索pdf文本 我找了很多。没有找到任何解决办法。 任何人都可以粘贴OCR PDFBox的代码。

试试

要提取文本,请执行以下操作:

有java库吗?如何使用任何java库生成可搜索文本?开源或付费

您可以使用Gnostice XtremeDocumentStudio for Java实现这一点。有关更多详细信息,请点击下面的链接

仅供参考,在本文中,我们演示了如何将扫描图像转换为可搜索的PDF。事实上,输入可以是任何扫描的文档图像、PDF或DOCX


免责声明:我为Gnostice工作。

PDDocument document=PDDocument.loadsrc;PDFTextStripper s=新的PDFTextStripper;字符串内容=s.getTextdocument;系统输出打印内容;我使用了这段代码,但仍然没有从图像中获取任何文本。如何使用PDFBox以编程方式搜索pdf文本?这是如何标记为正确答案的?!PDF框只能从可搜索的PDF中提取文本。。。它不支持OCR,也不将不可搜索的pdf转换为可搜索的pdf。PDFBOX不支持OCR,它只允许提取已经以文本形式存在的信息。伙计,我们可以使用PDFBOX制作文本可搜索的pdf吗?