Open source 手写数字最准确的开源OCR?

Open source 手写数字最准确的开源OCR?,open-source,numbers,ocr,handwriting,Open Source,Numbers,Ocr,Handwriting,我的软件需要读取一个固定长度的手写数字 虽然我可以使用像这样的通用库,但我相信还有更聪明的东西。Tesseract可能会将一些1或7误解为I或l,而只需要数字的软件则不会 由于知道只有数字(美式英语的书写方式),该算法可以专注于10个潜在匹配,而不是数百个符号 有没有手写数字字段的OCR经验? 您使用哪种开源库/软件获得了最佳效果?来自Tesseract: 如何仅识别数字? 在2.03及以上版本中: 使用 TessBaseAPI::SetVariable("tessedit_char_white

我的软件需要读取一个固定长度的手写数字

虽然我可以使用像这样的通用库,但我相信还有更聪明的东西。Tesseract可能会将一些1或7误解为I或l,而只需要数字的软件则不会

由于知道只有数字(美式英语的书写方式),该算法可以专注于10个潜在匹配,而不是数百个符号

有没有手写数字字段的OCR经验?
您使用哪种开源库/软件获得了最佳效果?

来自Tesseract:

如何仅识别数字?

在2.03及以上版本中:

使用

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");
在调用Init函数或将其放入名为
tessdata/configs/digits
的文本文件之前:

tessedit_char_whitelist 0123456789
然后您的命令行变成:

tesseract image.tif outputbase nobatch digits
警告:在新旧配置变量合并之前,您还必须具有
nobatch
参数


但我认为,由于它是为打印而不是手写文本设计的,因此即使仅为数字,其准确性也可能受到影响。

谢谢!但事实上,Tesseract似乎不是为手写的东西设计的,所以它可能在这方面相当平庸。@nic:也许你可以重新训练它。这似乎是可能的,似乎确实是可能的。但是当我向客户公司提出这个解决方案时,他们可能会觉得我很滑稽。。。社区(即使规模较小)的经验证解决方案可能更可信。如果它还不存在,我会感到惊讶。现在我想起来,手写数字应该不难识别。。。它们并没有像拉丁字母那样连接成模糊的单词。比手写文本更容易识别。@Nicolas,您是否为您的用例找到了合适的解决方案(适用于手写数字的OCR)?