C# 如何使用Tesseract改进结果识别?
我正在使用图片 我想从中识别数字C# 如何使用Tesseract改进结果识别?,c#,ocr,tesseract,text-recognition,C#,Ocr,Tesseract,Text Recognition,我正在使用图片 我想从中识别数字 var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly); engine.SetVariable("tessedit_char_whitelist", "0123456789"); var img = Pix.LoadFromFile(@"D:/Ex.png"); var page = engine.Process(img); var text = page
var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly);
engine.SetVariable("tessedit_char_whitelist", "0123456789");
var img = Pix.LoadFromFile(@"D:/Ex.png");
var page = engine.Process(img);
var text = page.GetText();
Console.Write("Press any key to continue . . . ");
Console.ReadKey(true);
结果非常糟糕313963
如何改进?您可以使用pic代替eng来训练自己的tessdata文件。 从github下载tesseract ocr的源代码(阅读wiki(–3.02),它可以帮助您训练您的tesseract数据。
希望有帮助。在白名单
引擎.SetVariable(“tessedit\u char\u whitelist”,“0123456789/”)中添加/
字符;
@mujahiddudkhan,没有帮助,结果是一样的。