Python 识别带有线性字母噪音的手写字母
识别手写字母时出现问题 下面是输入图像: 第一: 第二: 第三: 第四: 我使用tesseract识别字母:Python 识别带有线性字母噪音的手写字母,python,opencv,image-processing,ocr,tesseract,Python,Opencv,Image Processing,Ocr,Tesseract,识别手写字母时出现问题 下面是输入图像: 第一: 第二: 第三: 第四: 我使用tesseract识别字母: tesseract t4.png s -l wni_l --psm 6 其中wni_l是自训练数据: 结果如下: 第一名:AB 第二名:AB 第三名:AB 第四:巴西发展银行 我的问题是,有没有忽略划线或涂改的字母 可能需要通过opencv或其他机器学习技能(例如tensorflow)优化输入图像 所以,除了第一张图片,我需要得到B,而不是那些错误的结果 或者通过将这些人添加
tesseract t4.png s -l wni_l --psm 6
其中wni_l是自训练数据:
结果如下:
第一名:AB
第二名:AB
第三名:AB
第四:巴西发展银行
我的问题是,有没有忽略划线或涂改的字母
可能需要通过opencv或其他机器学习技能(例如tensorflow)优化输入图像
所以,除了第一张图片,我需要得到B,而不是那些错误的结果
或者通过将这些人添加到负面案例(如果使用SVM)来强制训练
环境:
Python 2.7.10
特塞特:4.0.0
Opencv:3.2.0
任何建议都非常感谢
谢谢
卫斯理