Forms 如何在扫描的文档图像上查找空白字段_Forms_Image Processing_Ocr_Fax_Image Recognition

Forms 如何在扫描的文档图像上查找空白字段

forms image-processing

Forms 如何在扫描的文档图像上查找空白字段,forms,image-processing,ocr,fax,image-recognition,Forms,Image Processing,Ocr,Fax,Image Recognition,我希望我的申请在表格中填写一个字段作为黑白图像文件存在。形式总是以相同的纸质版本开始，但在应用程序从我的用户那里得到它，它可能已经被扫描或传真了更多不止一次。因此，我需要的领域不在每个文件中的位置相同我的用户并不总是从我这里得到空白表格，所以我没有。有能力打印一个标记或占位符，我可以以后再认识原始空白表格上有文本，但因为可能已经传真，我只有200 dpi的决议。正文它总是大到足以让人阅读，但我对此持怀疑态度关于OCR 我有一些预算，所以我不需要一个免费的解决方案。。。让我

我希望我的申请在表格中填写一个字段作为黑白图像文件存在。形式总是以相同的纸质版本开始，但在应用程序从我的用户那里得到它，它可能已经被扫描或传真了更多不止一次。因此，我需要的领域不在每个文件中的位置相同

<>我的用户并不总是从我这里得到空白表格，所以我没有。有能力打印一个标记或占位符，我可以以后再认识

原始空白表格上有文本，但因为可能已经传真，我只有200 dpi的决议。正文它总是大到足以让人阅读，但我对此持怀疑态度关于OCR

我有一些预算，所以我不需要一个免费的解决方案。。。让我们就说2000美元吧

也就是说，我正在考虑

获取OCR解决方案以查找文本在我需要的字段上添加标签。我不知道我想我有足够的资源或者我有自己的专长。我不知道需要完美的认可，因为我已经知道课文上说了什么。但我确实需要知道X-和 Y坐标。有软件吗是这样吗？还是编程比我想象的要容易

构建或购买软件以识别形状的边缘。从那里，我可以得到物体的相对位置我需要的领域。我在想我的扫描仪软件在图像周围画了一条虚线小文件。那是已知的吗算法或是否有可用的解决方案

用其他方法来识别我需要的领域。谷歌的尝试填表软件给我 web表单的数百个匹配项， pdf表单等，它们不符合我的要求需要

我对语言不挑剔。我的应用程序运行在Linux上，但如果最好的解决方案是Microsoft，我可能可以让它工作

我很感激您的想法。

这里是一些可用OCR解决方案的小结（开源和非开源）：

如果我理解正确，表单总是一样的，但可能会因为复印/传真而移动、缩放或稍微旋转。在这种情况下，您的问题是图像配准：找到最佳刚性变换，使用户队列中的表单与您的“模型”表单对齐，您知道感兴趣的字段的位置。一旦知道了转换，就可以计算字段在用户表单中的位置

有许多图像配准算法，通常是为校准大脑的MR图像等应用而开发的。它们的计算成本很高，需要统计先验知识。幸运的是，您的情况更简单：您所需要做的就是在用户表单的内容周围填充一个矩形。协调下降应该有效。您需要对噪音（表格外的垃圾）有一定的容忍度。

严格的注册可能不够。用户可以修改模板表单的布局和格式，例如更改字体、更改复选框或输入框的位置、在不同换行位置打断段落等。这些差异比单纯的移位、旋转或缩放变换更复杂。此外，如果您的图像是二值图像（黑白），我认为那些医学图像配准算法（处理灰度图像）不会有多大帮助。您的成本函数和最小化策略可能会相应更改。

此处总结的解决方案将图像转换为文本。没有人说他们会告诉我识别文本在页面上的位置。你有这样做的经验吗？没有，我很抱歉地告诉你，我实际上没有OCR的经验。我提到那个链接是因为，当我读到它的时候，它对我来说是一个新闻，有任何开源的OCR和/或谷歌参与其中。我想你完全正确地理解了。这是很好的信息。你能解释一下你所说的坐标下降吗？Thanks@Raj：梯度下降的简单版本。循环遍历变量。对于每个变量，找到优化目标函数的变量的新值。重复，直到收敛。如有必要，请参阅“算法”标签中的问题并提问。严格的注册可能还不够。用户可以修改模板表单的布局和格式，例如更改字体、更改复选框的位置、在不同位置打断段落等。这些差异比单纯的移位、旋转或缩放转换更复杂。用户不能修改布局或格式。“表单始终以相同的纸质版本开始。”