Text OCR是如何工作的?以及如何将OCR添加到字母表中

Text OCR是如何工作的?以及如何将OCR添加到字母表中,text,nlp,ocr,Text,Nlp,Ocr,我有一个以前没有处理过的字母表,所以当扫描时,没有办法用OCR来检测字母进行识别。我正试图为它编写OCR程序,但在这方面没有太多经验。我希望您能给我一些提示,告诉我从哪里开始,以及这样一个系统通常是如何实现的。看一看——它描述了一个开源OCR引擎的培训过程。在第十八部分中有一系列关于照片OCR的课程 对课堂上讲授的示例进行了简要描述。谷歌图书提供了一些优秀的资源。类似地,如果你在亚马逊上搜索光学字符识别,有一些相当最新的书籍看起来相当厚,并且在智力上具有挑战性:呵呵 顺便说一句,我很清楚这篇文章

我有一个以前没有处理过的字母表,所以当扫描时,没有办法用OCR来检测字母进行识别。我正试图为它编写OCR程序,但在这方面没有太多经验。我希望您能给我一些提示,告诉我从哪里开始,以及这样一个系统通常是如何实现的。

看一看——它描述了一个开源OCR引擎的培训过程。

在第十八部分中有一系列关于照片OCR的课程


对课堂上讲授的示例进行了简要描述。

谷歌图书提供了一些优秀的资源。类似地,如果你在亚马逊上搜索光学字符识别,有一些相当最新的书籍看起来相当厚,并且在智力上具有挑战性:呵呵
顺便说一句,我很清楚这篇文章有一定的年龄,但你永远不知道什么时候其他人会偶然发现这篇文章,找到他们需要的东西。如果这甚至有机会帮上忙,那就这样吧。OCR是一门如此奇怪的学科,以至于没有太多的东西能够真正回答机器终结的深层问题。特别是如果你打算编写自己的库:这个问题的答案可以摆满书架。因此,这个问题实在太宽泛了。@Michael Petrotta,谢谢,但我必须从某个地方开始,所以任何能把我推向正确方向的提示都会很好。我并不认为这很容易,只是需要了解估计项目规模所涉及的内容。我想你还没有读过吗?我认为第一个评论甚至都不合适。考虑到这项技术的性质,以及明显缺乏关于OCR和编程更深层次的公开信息,我认为这是一个公平的问题,应该得到公平的回答。至少,这是一个正确方向上受过教育的点。