如何在pdf中可视化文本层

如何在pdf中可视化文本层,pdf,ocr,pdftotext,Pdf,Ocr,Pdftotext,我正在寻找一种方法,从带有“文本层”的PDF中提取文本和该文本的位置。 我的目标是将提取的文本显示为一个层,并让用户选择某些行作为感兴趣的区域 pdftotext只显示行中的文本,但不显示位置信息。 我从PDFlib查看了TET,但他们没有试用版,而且这些库似乎也不再积极维护 这个程序应该可以在Linux上运行好问题!你找到答案了吗\正在取得一些进展--->-但您实际上使用的是什么OCR引擎?这是一个非常普通的问题,因为我找不到已经提供此功能的库等。

我正在寻找一种方法,从带有“文本层”的PDF中提取文本和该文本的位置。 我的目标是将提取的文本显示为一个层,并让用户选择某些行作为感兴趣的区域

pdftotext只显示行中的文本,但不显示位置信息。 我从PDFlib查看了TET,但他们没有试用版,而且这些库似乎也不再积极维护


这个程序应该可以在Linux上运行

好问题!你找到答案了吗\正在取得一些进展--->-但您实际上使用的是什么OCR引擎?这是一个非常普通的问题,因为我找不到已经提供此功能的库等。