Ocr 使用勾选框扫描并读取文档

Ocr 使用勾选框扫描并读取文档,ocr,Ocr,我接到一位客户的请求,他希望为不同地区的老年人提供膳食。要做到这一点,人们需要填写一张本周的表格,并根据每天的选择勾选方框(它还考虑了具体的要求) 例如: Name Commune With salt ( ) Without salt [] Mon : Meal 1 ( ) Meal 2 ( ) Dessert 1 ( ) Dessert (

我接到一位客户的请求,他希望为不同地区的老年人提供膳食。要做到这一点,人们需要填写一张本周的表格,并根据每天的选择勾选方框(它还考虑了具体的要求)

例如:

 Name
 Commune

                  With salt ( )      Without salt []

Mon :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )

Tues :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )
然后将每张表格中的数据汇编起来,告诉我们每个社区每天要准备多少种膳食

这些表都是一样的,所以我希望能够扫描它们并自动读取它们

我不知道有什么软件可以让我这样做。完成这项任务的最佳方式是什么?目前我正在研究tesseract,但也许有一些更简单的技术


编辑:我们每周讨论几百张表格。理想情况下,我们将同时扫描它们,提取数据并以电子方式存储表单。

您不是在寻找OCR,这意味着要读取机器打印的字符。您正在寻找ICR/OMR软件,也称为表单处理或数据捕获。OMR代表光学标记识别,这是您试图做的,识别复选标记/复选框的值

有关手写识别的其他信息,请参见:

因为您的表单是相同的,这意味着您的表单属于“固定表单”类别,基于模板的软件包可以处理这些表单。下面是一个简短的文档,解释了表单类型之间的差异: www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf

您的空白表单本身也应该为机器识别而正确设计。它应该有参考标记,以便更好地对齐模板,清晰的流程,以便用户知道如何自然填写,以及适当大小的复选框等

我相信FlexiCapture将为您提供所需的一切:。至少还有其他几种解决方案可以执行类似的过程。我是纸质表单处理项目的集成商/顾问

我去掉了你的“手机”标签,因为我相信你不打算用手机拍摄这些图像。如果你是,如果你有其他选择,我建议你不要这样做。您提到用传统扫描仪扫描它们,这是获得良好图像质量的最佳选择。相信我,在处理手写表单时,您将有足够的时间来处理,因此尽可能优化您的表单、扫描、软件和流程

如果你有兴趣自己开发,这是可能的。该过程是将图像区域(每个复选标记)与一些“基线”进行比较,以查看该区域是否有额外的手写。如果超过某个阈值,则选中标记已被选中。典型问题是区域对齐和临界阈值水平(小/浅刻度线)。商业软件包会自动处理这个问题

如果您需要任何其他指导,请告诉我


伊利亚·埃夫多基莫夫

谢谢,回答得很好。我们先来看看商业软件,如果有必要,我可以开发一些定制的软件。