C# 如何使用Tesseract改进结果识别？_C#_Ocr_Tesseract_Text Recognition

C# 如何使用Tesseract改进结果识别？

C# 如何使用Tesseract改进结果识别？,c#,ocr,tesseract,text-recognition,C#,Ocr,Tesseract,Text Recognition,我正在使用图片我想从中识别数字 var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly); engine.SetVariable("tessedit_char_whitelist", "0123456789"); var img = Pix.LoadFromFile(@"D:/Ex.png"); var page = engine.Process(img); var text = page

我正在使用图片

我想从中识别数字

var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly);
engine.SetVariable("tessedit_char_whitelist", "0123456789");
var img = Pix.LoadFromFile(@"D:/Ex.png");
var page = engine.Process(img);
var text = page.GetText();
Console.Write("Press any key to continue . . . ");
Console.ReadKey(true);

结果非常糟糕

如何改进？

您可以使用pic代替eng来训练自己的tessdata文件。从github下载tesseract ocr的源代码（阅读wiki（–3.02），它可以帮助您训练您的tesseract数据。

希望有帮助。

在白名单

引擎.SetVariable（“tessedit\u char\u whitelist”，“0123456789/”）中添加/
字符；

@mujahiddudkhan，没有帮助，结果是一样的。