Forms 如何在扫描的文档图像上查找空白字段

Forms 如何在扫描的文档图像上查找空白字段,forms,image-processing,ocr,fax,image-recognition,Forms,Image Processing,Ocr,Fax,Image Recognition,我希望我的申请在表格中填写一个字段 作为黑白图像文件存在。形式总是 以相同的纸质版本开始,但在 应用程序从我的用户那里得到它,它可能已经被扫描或传真了更多 不止一次。因此,我需要的领域不在 每个文件中的位置相同 我的用户并不总是从我这里得到空白表格,所以我没有。 有能力打印一个标记或占位符,我可以 以后再认识 原始空白表格上有文本,但因为可能 已经传真,我只有200 dpi的决议。正文 它总是大到足以让人阅读,但我对此持怀疑态度 关于OCR 我有一些预算,所以我不需要一个免费的解决方案。。。让我

我希望我的申请在表格中填写一个字段 作为黑白图像文件存在。形式总是 以相同的纸质版本开始,但在 应用程序从我的用户那里得到它,它可能已经被扫描或传真了更多 不止一次。因此,我需要的领域不在 每个文件中的位置相同

<>我的用户并不总是从我这里得到空白表格,所以我没有。 有能力打印一个标记或占位符,我可以 以后再认识

原始空白表格上有文本,但因为可能 已经传真,我只有200 dpi的决议。正文 它总是大到足以让人阅读,但我对此持怀疑态度 关于OCR

我有一些预算,所以我不需要一个免费的解决方案。。。让我们 就说2000美元吧

也就是说,我正在考虑

  • 获取OCR解决方案以查找文本 在我需要的字段上添加标签。我不知道 我想我有足够的资源或者 我有自己的专长。我不知道 需要完美的认可,因为我 已经知道课文上说了什么。 但我确实需要知道X-和 Y坐标。有软件吗 是这样吗?还是编程比我想象的要容易

  • 构建或购买软件以识别 形状的边缘。从那里, 我可以得到物体的相对位置 我需要的领域。我在想 我的扫描仪软件在图像周围画了一条虚线 小文件。那是已知的吗 算法或是否有可用的 解决方案

  • 用其他方法来识别 我需要的领域。谷歌的尝试 填表软件给我 web表单的数百个匹配项, pdf表单等,它们不符合我的要求 需要

  • 我对语言不挑剔。我的应用程序运行在Linux上,但如果最好的解决方案是Microsoft,我可能可以让它工作


    我很感激您的想法。

    这里是一些可用OCR解决方案的小结(开源和非开源):

    如果我理解正确,表单总是一样的,但可能会因为复印/传真而移动、缩放或稍微旋转。在这种情况下,您的问题是图像配准:找到最佳刚性变换,使用户队列中的表单与您的“模型”表单对齐,您知道感兴趣的字段的位置。一旦知道了转换,就可以计算字段在用户表单中的位置


    有许多图像配准算法,通常是为校准大脑的MR图像等应用而开发的。它们的计算成本很高,需要统计先验知识。幸运的是,您的情况更简单:您所需要做的就是在用户表单的内容周围填充一个矩形。协调下降应该有效。您需要对噪音(表格外的垃圾)有一定的容忍度。

    严格的注册可能不够。用户可以修改模板表单的布局和格式,例如更改字体、更改复选框或输入框的位置、在不同换行位置打断段落等。这些差异比单纯的移位、旋转或缩放变换更复杂。此外,如果您的图像是二值图像(黑白),我认为那些医学图像配准算法(处理灰度图像)不会有多大帮助。您的成本函数和最小化策略可能会相应更改。

    此处总结的解决方案将图像转换为文本。没有人说他们会告诉我识别文本在页面上的位置。你有这样做的经验吗?没有,我很抱歉地告诉你,我实际上没有OCR的经验。我提到那个链接是因为,当我读到它的时候,它对我来说是一个新闻,有任何开源的OCR和/或谷歌参与其中。我想你完全正确地理解了。这是很好的信息。你能解释一下你所说的坐标下降吗?Thanks@Raj:梯度下降的简单版本。循环遍历变量。对于每个变量,找到优化目标函数的变量的新值。重复,直到收敛。如有必要,请参阅“算法”标签中的问题并提问。严格的注册可能还不够。用户可以修改模板表单的布局和格式,例如更改字体、更改复选框的位置、在不同位置打断段落等。这些差异比单纯的移位、旋转或缩放转换更复杂。用户不能修改布局或格式。“表单始终以相同的纸质版本开始。”