Python PyteSeract-输出极不准确(MAC)

Python PyteSeract-输出极不准确(MAC),python,text,python-tesseract,Python,Text,Python Tesseract,我通过pip安装了pytesseract,结果非常糟糕 当我搜索它的时候,我想我需要给它更多的数据 但是我找不到tessedata(traineddata)的位置 因为没有类似ProgramFile\t的目录,所以请使用Mac执行OCR 图像的分辨率、字体或大小没有问题。 因为大而清晰的测试图像工作正常,我认为这是一个缺乏数据的问题。 但任何其他可能的解决方案都是受欢迎的,只要它可以用Python读取文本 请帮帮我 我通过pip安装了pytesseract,结果非常糟糕 有时需要对输入图像进行

我通过pip安装了pytesseract,结果非常糟糕

当我搜索它的时候,我想我需要给它更多的数据 但是我找不到tessedata(traineddata)的位置 因为没有类似ProgramFile\t的目录,所以请使用Mac执行OCR

图像的分辨率、字体或大小没有问题。

因为大而清晰的测试图像工作正常,我认为这是一个缺乏数据的问题。 但任何其他可能的解决方案都是受欢迎的,只要它可以用Python读取文本

请帮帮我

我通过pip安装了pytesseract,结果非常糟糕

有时需要对输入图像进行预处理以获得准确的结果

因为大而清晰的测试图像工作正常,我认为这是一个缺乏数据的问题。但任何其他可能的解决方案都是受欢迎的,只要它可以用Python读取文本

你可以说缺乏数据是一个问题。我想你会发现有用的

例如,如果我们应用
close
操作,结果将是:

该图像看起来与原始发布的图像相似。但是,输出图像中有轻微变化(即语法单词与原始图像略有不同)

现在,如果我们读取输出图像:

English
Grammar Practice
ter K-SAT (1-10)
代码:

导入cv2
从PyteSeract导入图像到字符串
img=cv2.imread(“6Celp.jpg”)
gry=cv2.CVT颜色(img,cv2.COLOR\u BGR2GRAY)
opn=cv2.形态学(gry,cv2.形态开放,无)
txt=图像到字符串(opn)
txt=txt.split(“\n”)
对于txt中的i:
i=i.条带()
如果我和len(i)>3:
印刷品(一)

你能详细解释一下你所说的“跑得真差”是什么意思吗?听起来你没有得到正确的结果,而且你不确定把训练数据放在哪里?这正是我的意思。即使我放了一个足够大和清晰的图像,它也不能正确地识别它。由于我在数小时的搜索中没有找到问题的答案,但我把数据放在了哪里,我质疑我应该把数据放在哪里,但我不确定这是什么原因。谢谢你试着帮助我,很抱歉我的英语很差。谢谢你的帮助@“窗台”确保在处理旋转图像时搜索图像倾斜和校正。