Python 识别带有线性字母噪音的手写字母

Python 识别带有线性字母噪音的手写字母,python,opencv,image-processing,ocr,tesseract,Python,Opencv,Image Processing,Ocr,Tesseract,识别手写字母时出现问题 下面是输入图像: 第一: 第二: 第三: 第四: 我使用tesseract识别字母: tesseract t4.png s -l wni_l --psm 6 其中wni_l是自训练数据: 结果如下: 第一名:AB 第二名:AB 第三名:AB 第四:巴西发展银行 我的问题是,有没有忽略划线或涂改的字母 可能需要通过opencv或其他机器学习技能(例如tensorflow)优化输入图像 所以,除了第一张图片,我需要得到B,而不是那些错误的结果 或者通过将这些人添加

识别手写字母时出现问题

下面是输入图像:

第一:

第二:

第三:

第四:

我使用tesseract识别字母:

tesseract t4.png s -l wni_l --psm 6
其中wni_l是自训练数据:

结果如下:

第一名:AB

第二名:AB

第三名:AB

第四:巴西发展银行

我的问题是,有没有忽略划线或涂改的字母

可能需要通过opencv或其他机器学习技能(例如tensorflow)优化输入图像

所以,除了第一张图片,我需要得到B,而不是那些错误的结果

或者通过将这些人添加到负面案例(如果使用SVM)来强制训练

环境:

Python 2.7.10

特塞特:4.0.0

Opencv:3.2.0

任何建议都非常感谢

谢谢

卫斯理