Java 将经过训练的tesseract文件合并为一个

Java 将经过训练的tesseract文件合并为一个,java,macos,ocr,Java,Macos,Ocr,我正在Mac上使用最新版本的Tesseract。我在一个文件夹中有一个eng.traineddata,在另一个文件夹中有一个eng.traineddata。我希望将我的traineddata文件合并成一个大的、经过训练的字体文件 谁能告诉我怎么做?我在某处读到,-l命令可能就是我所需要的 谢谢 Tesseract不在两个不同的文件夹中查找语言数据。您可以将其中一个重命名,例如,重命名为eng1.traineddata,然后将它们指定为-l eng+eng1选项,以执行teseract命令。我也尝

我正在Mac上使用最新版本的Tesseract。我在一个文件夹中有一个eng.traineddata,在另一个文件夹中有一个eng.traineddata。我希望将我的traineddata文件合并成一个大的、经过训练的字体文件

谁能告诉我怎么做?我在某处读到,-l命令可能就是我所需要的


谢谢

Tesseract不在两个不同的文件夹中查找语言数据。您可以将其中一个重命名,例如,重命名为
eng1.traineddata
,然后将它们指定为
-l eng+eng1
选项,以执行
teseract
命令。

我也尝试过这样做,但似乎只有通过同时编译多个图像来创建traineddata文件时才有可能。 下面是详细的程序


“”

因此,为了验证,如果我按照你说的做了,确切的命令是:tesseract-l eng+eng1。另外,为了详细说明,我正在从mac for iOS编译此命令。我在iOS上运行得很好,但希望将这两个单独的经过训练的文件合并成1个经过训练的数据,以放入我的xcode项目中。谢谢你的帮助!确切的命令是:
tesseract imagefile outfile-l eng+eng1
。由于Tesseract项目未发布原始培训源,因此“合并traineddata文件”选项不可用。如果我有错误,请更正我,但您在上面给出的命令没有将每个traineddata合并为一个正确的文件?相反,该命令简单地读取终端内的“图像文件”?所以我的问题是,如果我是为objective-c这样做的,那么是否可以同时使用这两个traineddata文件?再次感谢,will接受该命令是用于命令行执行的。它不合并,但告诉Tesseract引擎使用两种语言的数据包。在objective-c中,您可以在
Init
方法中指定它,如下所示:
tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding],“eng+eng1”)