Java 如何用三种不同的笔迹训练同一数字的tesseract ocr？_Java_Ocr_Tesseract

Java 如何用三种不同的笔迹训练同一数字的tesseract ocr？

java

Java 如何用三种不同的笔迹训练同一数字的tesseract ocr？,java,ocr,tesseract,Java,Ocr,Tesseract,我用java编写了一个程序，可以从扫描的tiff图像中读取字符，但精度不太好如果我们更改文档中的手写体，则结果会略有不同。那么，是否有任何方法可以训练tesseract ocr 我也使用了jtessEditorBox，但没有任何帮助。我建议你挖掘这篇文章：为每个笔迹获取图片。在多张图片上使用“QT框编辑器”将框与字符关联。然后将它们交给tesseract，以便使用“train.sh”脚本对其进行训练（可能会更正其中的一些错误）。我没有使用“train2.sh”，因为在我的例子中它似

我用java编写了一个程序，可以从扫描的tiff图像中读取字符，但精度不太好

如果我们更改文档中的手写体，则结果会略有不同。那么，是否有任何方法可以训练tesseract ocr

我也使用了jtessEditorBox，但没有任何帮助。

我建议你挖掘这篇文章：

为每个笔迹获取图片。在多张图片上使用“QT框编辑器”将框与字符关联。然后将它们交给tesseract，以便使用“train.sh”脚本对其进行训练（可能会更正其中的一些错误）。我没有使用“train2.sh”，因为在我的例子中它似乎适得其反。将所有手写训练数据文件添加到tesseract配置文件。

您可以更改“QT Box Editor”配置，以设置不同语言的手写体。

我建议您阅读以下文章：

为每个笔迹获取图片。在多张图片上使用“QT框编辑器”将框与字符关联。然后将它们交给tesseract，以便使用“train.sh”脚本对其进行训练（可能会更正其中的一些错误）。我没有使用“train2.sh”，因为在我的例子中它似乎适得其反。将所有手写训练数据文件添加到tesseract配置文件。您可以更改“QT框编辑器”配置，以设置不同语言的手写