Ios Tesseract培训:只需几句话

Ios Tesseract培训:只需几句话,ios,ocr,tesseract,training-data,Ios,Ocr,Tesseract,Training Data,我需要训练tesseract只识别十个单词。 单词是制药公司的名称,类似于:Atrasil,Spectful 因为使用的字体非常常见,所以我尝试解包eng.traineddata,用这些单词替换freq-dawg和word-dawg。然后我将它们重新打包到一个新的traineddata中,不幸的是,它似乎工作得不太好。匹配结果仍然是不可接受的,即使使用从简单word文件获得的图像,我也不能使用它们。 有没有办法实现良好的匹配?我需要从解包训练数据中删除其他文件吗?我没有投票反对,但这是非常具体的

我需要训练tesseract只识别十个单词。
单词是制药公司的名称,类似于:Atrasil,Spectful
因为使用的字体非常常见,所以我尝试解包eng.traineddata,用这些单词替换freq-dawg和word-dawg。然后我将它们重新打包到一个新的traineddata中,不幸的是,它似乎工作得不太好。匹配结果仍然是不可接受的,即使使用从简单word文件获得的图像,我也不能使用它们。

有没有办法实现良好的匹配?我需要从解包训练数据中删除其他文件吗?

我没有投票反对,但这是非常具体的IMHO I;我建议在tesseract论坛/用户群中提问?Thx Daji我会在那里看看,但是我已经看到了很多类似的问题,tesseract是这里的主题。当没有人解释原因时,你就讨厌投下一票,这就像懦弱。你试过
bazaar
模式吗?谢谢@nguyenq我已经读过了,但它似乎没有添加到tesseract的ios版本中。您可以创建一个
eng.user-words
文件,并进行几个
setVariable
调用来模拟
bazaar
配置设置。