如何在TIFF图像上覆盖文本,创建类似可搜索pdf的内容?

如何在TIFF图像上覆盖文本,创建类似可搜索pdf的内容?,pdf,ocr,tiff,Pdf,Ocr,Tiff,我希望有一个应用程序,其中用户可以查看TIFF格式的文档图像 如果页面上出现foo和bar字样。在只包含foo的图像上进行选择,然后我只想选择foo这个词 是否有一种格式可以同时存储文本的位置和图像的文本?既然您知道可搜索PDF,并且它完美地实现了您的建议,我认为您不能使用它是有原因的。如果不是,你应该使用PDF格式-该格式支持混合内容并覆盖它们。您的用户可能拥有的所有查看者都将了解如何处理图像下的文本 TIFF格式不直接支持这一点,但是如果您正在制作查看器,并且它只需要在那里工作,那么您可以尝

我希望有一个应用程序,其中用户可以查看TIFF格式的文档图像

如果页面上出现foo和bar字样。在只包含foo的图像上进行选择,然后我只想选择foo这个词


是否有一种格式可以同时存储文本的位置和图像的文本?

既然您知道可搜索PDF,并且它完美地实现了您的建议,我认为您不能使用它是有原因的。如果不是,你应该使用PDF格式-该格式支持混合内容并覆盖它们。您的用户可能拥有的所有查看者都将了解如何处理图像下的文本

TIFF格式不直接支持这一点,但是如果您正在制作查看器,并且它只需要在那里工作,那么您可以尝试将文本和位置存储在自定义标记中

然后,您的查看器需要读取此标记,解释鼠标位置,并查找图像上正在选择的文本。没有其他查看器支持您的文本标记,但它们会显示TIFF

对于这两种机制中的任何一种,您都需要OCR和将获取的数据编码为PDF或自定义TIFF标记的方法。关于开源OCR,请看一下谷歌的Tesseract


免责声明:我在Atalasoft工作。我们的imaging SDK具有OCR附加组件,可以制作可搜索的PDF,并可以添加和编辑TIFF标签。

PDF有什么问题?你可以用PDF格式做这件事。任何应用OCR的PDF文件都将是这样。我需要建立一个文档数据库。