Opencv OCR几乎没有已知的表单格式。从哪里开始?

Opencv OCR几乎没有已知的表单格式。从哪里开始?,opencv,ocr,tesseract,image-scanner,Opencv,Ocr,Tesseract,Image Scanner,我有一些已知格式的文档的照片/扫描。每个文档都包含一些已知属性(日期/时间、名称和项目列表) 你能建议从(目标)C/C++)开始使用哪些应用程序/库吗?OpenCV能做到吗?OCR呢?OCR的版面识别 谢谢 另外,请建议如何重新措辞我的帖子 p.p.S.我发现了一些很有前途的工具(包括iOS示例):和要检测文本在页面上的位置,我建议使用OpenCV进行检测,然后将文本区域发送给tesseract 查找文本: 侵蚀图像 寻找轮廓 获取轮廓的边界框 这些边界框应包含文本或徽标/图片。请说明您否决投票

我有一些已知格式的文档的照片/扫描。每个文档都包含一些已知属性(日期/时间、名称和项目列表)

你能建议从(目标)C/C++)开始使用哪些应用程序/库吗?OpenCV能做到吗?OCR呢?OCR的版面识别

谢谢

另外,请建议如何重新措辞我的帖子


p.p.S.我发现了一些很有前途的工具(包括iOS示例):和

要检测文本在页面上的位置,我建议使用OpenCV进行检测,然后将文本区域发送给tesseract

查找文本:

侵蚀图像

寻找轮廓

获取轮廓的边界框


这些边界框应包含文本或徽标/图片。

请说明您否决投票的原因,这有助于改进:(您可能还希望使用条件拒绝某些框,例如非常小或非常大的框。您可以通过检查轮廓区域来实现这一点。