Forms 通过字段识别和光学字符识别(OCR)在预定义表单上手写实现数据输入自动化

Forms 通过字段识别和光学字符识别(OCR)在预定义表单上手写实现数据输入自动化,forms,opencv,computer-vision,ocr,tesseract,Forms,Opencv,Computer Vision,Ocr,Tesseract,我希望从手工填写的预定义表单中自动输入数据。字符不分开,但字段可以通过下面的行或作为表的一部分来识别。我知道手写OCR仍然是一个活跃的研究领域,我可以包括一个操作员审查功能,所以我不希望准确率超过90% 我想到的第一个解决方案是将OpenCV用于字段识别()和Tesseract用于手写识别() 另一种潜在的更简单、更有效的方法,用预先定义的形式进行字段识别,可以从填充的形式中减去空白形式。由于表格将被扫描,这可能需要一些位置公差、降噪和特征识别 如有任何建议或意见,我们将不胜感激。如Tesser

我希望从手工填写的预定义表单中自动输入数据。字符不分开,但字段可以通过下面的行或作为表的一部分来识别。我知道手写OCR仍然是一个活跃的研究领域,我可以包括一个操作员审查功能,所以我不希望准确率超过90%

我想到的第一个解决方案是将OpenCV用于字段识别()和Tesseract用于手写识别()

另一种潜在的更简单、更有效的方法,用预先定义的形式进行字段识别,可以从填充的形式中减去空白形式。由于表格将被扫描,这可能需要一些位置公差、降噪和特征识别

如有任何建议或意见,我们将不胜感激。

如Tesseract中所述,如果您正在寻找成功的手写识别,则不建议使用。我建议您更多地关注商业项目,比如(向下滚动以从图像中读取手写文本),您可以在线尝试,并在应用程序中使用它们的API

另一个选择是ABBYY OCR,它有很多有用的功能来识别表格、复杂的文档等。您可以阅读更多内容

至于免费选择,我唯一想到的是

至于字母的检测——这实际上取决于输入,一般来说,如果你的表单每次都差不多——最好只测量你的表单,并使用预定义的位置来搜索文本。另外,OpenCV是一种查找文本的正确技术,在stackoverflow上有很多在线教程和很好的答案,例如,您可以通过消音器查看答案。

您可以查看以获得一般方法让我们来看看。