Python Tesseract序列特定字符

Python Tesseract序列特定字符,python,ocr,tesseract,python-tesseract,tesstrain,Python,Ocr,Tesseract,Python Tesseract,Tesstrain,是否有可能提高现有traineddata模型中特定字符的准确性 例如: 数字3通常会被检测为5 数字5通常被检测为8 W通常被检测为V 仅使用这些字符微调eng.traineddata是否有意义,以提高这些特定字符的准确性 我尝试使用基于线的图像数据训练eng.traineddata模型,示例中字符的精度显著提高。但在新的模型中,在以前的模型中被很好识别的字母被错误地识别。(过配?它在特定字体上失败还是在一般情况下失败?你可以在更多字体和更多数据(所有字符)上训练它,看看这是否能改善结果。它

是否有可能提高现有traineddata模型中特定字符的准确性

例如:

  • 数字3通常会被检测为5
  • 数字5通常被检测为8
  • W通常被检测为V
仅使用这些字符微调eng.traineddata是否有意义,以提高这些特定字符的准确性


我尝试使用基于线的图像数据训练eng.traineddata模型,示例中字符的精度显著提高。但在新的模型中,在以前的模型中被很好识别的字母被错误地识别。(过配?

它在特定字体上失败还是在一般情况下失败?你可以在更多字体和更多数据(所有字符)上训练它,看看这是否能改善结果。它在特定字体上失败了还是在一般情况下失败了?您只需在更多字体和更多数据(所有字符)上对其进行训练,看看这是否会改善结果