Java 如何用三种不同的笔迹训练同一数字的tesseract ocr?

Java 如何用三种不同的笔迹训练同一数字的tesseract ocr?,java,ocr,tesseract,Java,Ocr,Tesseract,我用java编写了一个程序,可以从扫描的tiff图像中读取字符,但精度不太好 如果我们更改文档中的手写体,则结果会略有不同。 那么,是否有任何方法可以训练tesseract ocr 我也使用了jtessEditorBox,但没有任何帮助。我建议你挖掘这篇文章: 为每个笔迹获取图片。 在多张图片上使用“QT框编辑器”将框与字符关联。 然后将它们交给tesseract,以便使用“train.sh”脚本对其进行训练(可能会更正其中的一些错误)。 我没有使用“train2.sh”,因为在我的例子中它似

我用java编写了一个程序,可以从扫描的tiff图像中读取字符,但精度不太好

如果我们更改文档中的手写体,则结果会略有不同。 那么,是否有任何方法可以训练tesseract ocr


我也使用了jtessEditorBox,但没有任何帮助。

我建议你挖掘这篇文章:

为每个笔迹获取图片。 在多张图片上使用“QT框编辑器”将框与字符关联。 然后将它们交给tesseract,以便使用“train.sh”脚本对其进行训练(可能会更正其中的一些错误)。 我没有使用“train2.sh”,因为在我的例子中它似乎适得其反。 将所有手写训练数据文件添加到tesseract配置文件。
您可以更改“QT Box Editor”配置,以设置不同语言的手写体。

我建议您阅读以下文章:

为每个笔迹获取图片。 在多张图片上使用“QT框编辑器”将框与字符关联。 然后将它们交给tesseract,以便使用“train.sh”脚本对其进行训练(可能会更正其中的一些错误)。 我没有使用“train2.sh”,因为在我的例子中它似乎适得其反。 将所有手写训练数据文件添加到tesseract配置文件。 您可以更改“QT框编辑器”配置,以设置不同语言的手写