从哪里开始进行基于Java的文本模式识别

从哪里开始进行基于Java的文本模式识别,java,pattern-matching,ocr,Java,Pattern Matching,Ocr,我正在认真考虑做一个光学字符识别程序。我非常熟悉Java,并且很想知道那里有哪些可用的库。基本上,我想将如下内容转换为文本。我需要手动中断以指定模式。例如,我需要要求用户在本文中标记f,以便知道f出现的位置 我完全是个新手,所以我也不介意从头开始学习。需要指导。如果您正在考虑从头开始编写OCR程序,阅读相关技术可能会很有用。我找到了一个评论十五年前流行技术的网站。阅读可能有帮助的书籍;追踪它引用的论文或引用它的论文 通常过程如下: find text find characters in th

我正在认真考虑做一个光学字符识别程序。我非常熟悉Java,并且很想知道那里有哪些可用的库。基本上,我想将如下内容转换为文本。我需要手动中断以指定模式。例如,我需要要求用户在本文中标记f,以便知道f出现的位置


我完全是个新手,所以我也不介意从头开始学习。需要指导。

如果您正在考虑从头开始编写OCR程序,阅读相关技术可能会很有用。我找到了一个评论十五年前流行技术的网站。阅读可能有帮助的书籍;追踪它引用的论文或引用它的论文

通常过程如下:

find text
find characters in the text
extract features from the characters found
do pattern matching
report suspected character
虽然让用户对文本进行注释既有趣又令人兴奋,但找到一组已经注释的手写体可能会为您节省大量时间,这样您就可以专注于进行OCR的细节,而不是构建自己的注释文本数据库


从一个稍微简单的任务开始,您可能需要考虑建立一个系统来检测手写数字。USPS为开发用于邮政编码处理的系统提供了一个解决方案。这个链接是我通过快速搜索找到的。

如果你想使用/查看图书馆,你可以试试谷歌认可的。

这里有一些建议。你是想滚动你自己的OCR,还是想寻找已经存在的Java OCR软件?我在搜索[OCR]时也找到了。这里有另一个相关的调查,以及大量的讨论