Image processing 图像中的半自动文本高亮显示?

Image processing 图像中的半自动文本高亮显示?,image-processing,automation,ocr,Image Processing,Automation,Ocr,向飞越者致意 鉴于: 我有混合语言文本的文档图像 我需要这个文本是高亮显示(逐字)的最终用户 我已经有了纯数字格式的文本 我将帮助我的程序找出单词的位置 我不希望我的帮助对我来说是乏味的 我也会在我的程序完成后手动修复一些小的错误 为了让我的程序能够围绕选定的单词绘制矩形,我能提供的最简单的帮助是什么?这个程序使用什么算法?我尝试了OmniPage Pro之类的OCR功能,但它们不提供这种功能 关于几年前,我在应用程序中实现了一个单词边界框并突出显示单词。你说“我有这个纯数字格式的文本”。一

向飞越者致意

鉴于:

  • 我有混合语言文本的文档图像
  • 我需要这个文本是高亮显示(逐字)的最终用户
  • 我已经有了纯数字格式的文本
  • 我将帮助我的程序找出单词的位置
  • 我不希望我的帮助对我来说是乏味的
  • 我也会在我的程序完成后手动修复一些小的错误
为了让我的程序能够围绕选定的单词绘制矩形,我能提供的最简单的帮助是什么?这个程序使用什么算法?我尝试了OmniPage Pro之类的OCR功能,但它们不提供这种功能


关于

几年前,我在应用程序中实现了一个单词边界框并突出显示单词。你说“我有这个纯数字格式的文本”。一个关键的组成部分是要有字符或单词的坐标,以便将它们映射到适当的图像区域。与可搜索PDF一样,当您选择文本时,它会在内部映射到图像层,而图像上的相反选择会选择匹配的文本。但我相信,即使从PDF文件中也无法导出这些坐标。如果文本中当前不存在此类坐标信息,最简单的方法可能是使用高质量引擎重新生成OCR图像,该引擎可以生成坐标作为输出的一部分。如果要使用WiseTREND OCR Cloud 2.0,那么XML输出将生成所有详细的元数据。如果存在坐标信息,那么所有主要组件都在那里,这只是围绕高效的UI设计工作。

您知道您应该在您的个人资料和任何提及您产品的答案中披露您的从属关系,对吗?另外,你也知道人们讨厌垃圾邮件,如果你看起来在发垃圾邮件,他们会做出负面反应,对吧?嗨,会的。以上答案已经有一年多的历史了,即使在今天,如果我按照geeko的要求去做的话,我将如何完成这项任务。披露:我曾参与WiseTREND OCR Cloud 2.0的开发,并使用它开发与geeko要求的功能类似的应用程序。据我所知,当时没有其他选择。