Python 如何为tesseract(Pyteseract)最佳使用TesserData_。论点和程序是什么?

Python 如何为tesseract(Pyteseract)最佳使用TesserData_。论点和程序是什么?,python,ocr,tesseract,python-tesseract,tesseract.js,Python,Ocr,Tesseract,Python Tesseract,Tesseract.js,TL;DR:如何在ubuntu18中安装tessdata\u best以与pytesseract一起使用incideconda 我已经在pytesseract内部conda环境中使用了相当长的一段时间,但是需要提高准确性,我发现tessdata\u best为您提供了最好的准确性。如何安装和使用该版本?我使用的是ubuntu18,必须使用pytesseract 我的tesseract安装在/usr/share/tesseract ocr/上,里面只有1个tesseract数据 我是否需要通过将t

TL;DR:如何在
ubuntu18
中安装
tessdata\u best
以与
pytesseract
一起使用
incide
conda

我已经在
pytesseract
内部
conda
环境中使用了相当长的一段时间,但是需要提高准确性,我发现
tessdata\u best
为您提供了最好的准确性。如何安装和使用该版本?我使用的是
ubuntu18
,必须使用
pytesseract

我的
tesseract
安装在
/usr/share/tesseract ocr/
上,里面只有1个
tesseract数据

我是否需要通过将
tessdata
复制到
/usr/share/tesseract ocr/
旁边的
tessdata
目录,从github获取

即使如此,如果我想最好地使用数据,我必须使用什么?是否需要将
配置更改为
--oem 0/1/2/3

第三件也是最后一件事是,我在
/home/deshwal/anaconda3/envs/py36/share/tessdata/eng.traineddata
上有我的
语言.trainedata
文件。我是否也需要在此位置粘贴
tessdata\u best
?因为当我尝试更改语言目录时,会出现如下错误:


/home/deshwal/anaconda3/envs/py36/share/tessdata/eq.traineddata请确保将tessdata\u PREFIX环境变量设置为“tessdata”目录。加载语言'eq\'失败Tesseract无法加载任何语言!无法初始化tesseract。“

我不知道我是否清楚地理解了您的问题,但是请让我知道下面是否有帮助。。。 您需要将数据路径设置为您将复制tessdata_最佳训练模型的位置,例如

Tesseract Tesseract=新的Tesseract();//JNA接口映射 setDatapath(“/home/tesseract/tessdata_best_4_0_0/tessdata”)

从()下载的所有.traineddata文件都应放在setDataPath中定义的目录中(例如,/home/tesseract/tessdata\u best\u 4\u 0\u 0/tessdata)

请注意:这些型号仅适用于Tesseract 4的LSTM OCR引擎,因此请确保您使用了library 4.1或更高版本

问候,,
莫利克

如果你找到了答案,请告诉我。如果你没有,试着在新的图像上重新训练Tesseract——这是一个相当好的学习过程,但我认为最终还是值得的。祝你好运!