Python PyteSeract-输出极不准确（MAC）_Python_Text_Python Tesseract

Python PyteSeract-输出极不准确（MAC）

python text

Python PyteSeract-输出极不准确（MAC）,python,text,python-tesseract,Python,Text,Python Tesseract,我通过pip安装了pytesseract，结果非常糟糕当我搜索它的时候，我想我需要给它更多的数据但是我找不到tessedata（traineddata）的位置因为没有类似ProgramFile\t的目录，所以请使用Mac执行OCR 图像的分辨率、字体或大小没有问题。因为大而清晰的测试图像工作正常，我认为这是一个缺乏数据的问题。但任何其他可能的解决方案都是受欢迎的，只要它可以用Python读取文本请帮帮我我通过pip安装了pytesseract，结果非常糟糕有时需要对输入图像进行

我通过pip安装了pytesseract，结果非常糟糕

当我搜索它的时候，我想我需要给它更多的数据但是我找不到tessedata（traineddata）的位置因为没有类似ProgramFile\t的目录，所以请使用Mac执行OCR

图像的分辨率、字体或大小没有问题。

因为大而清晰的测试图像工作正常，我认为这是一个缺乏数据的问题。但任何其他可能的解决方案都是受欢迎的，只要它可以用Python读取文本

请帮帮我

我通过pip安装了pytesseract，结果非常糟糕

有时需要对输入图像进行预处理以获得准确的结果

因为大而清晰的测试图像工作正常，我认为这是一个缺乏数据的问题。但任何其他可能的解决方案都是受欢迎的，只要它可以用Python读取文本

你可以说缺乏数据是一个问题。我想你会发现有用的

例如，如果我们应用

close

操作，结果将是：

该图像看起来与原始发布的图像相似。但是，输出图像中有轻微变化（即语法单词与原始图像略有不同）

现在，如果我们读取输出图像：

English
Grammar Practice
ter K-SAT (1-10)

代码：

导入cv2
从PyteSeract导入图像到字符串
img=cv2.imread（“6Celp.jpg”）
gry=cv2.CVT颜色（img，cv2.COLOR\u BGR2GRAY）
opn=cv2.形态学（gry，cv2.形态开放，无）
txt=图像到字符串（opn）
txt=txt.split（“\n”）
对于txt中的i：
i=i.条带（）
如果我和len（i）>3：
印刷品（一）

你能详细解释一下你所说的“跑得真差”是什么意思吗？听起来你没有得到正确的结果，而且你不确定把训练数据放在哪里？这正是我的意思。即使我放了一个足够大和清晰的图像，它也不能正确地识别它。由于我在数小时的搜索中没有找到问题的答案，但我把数据放在了哪里，我质疑我应该把数据放在哪里，但我不确定这是什么原因。谢谢你试着帮助我，很抱歉我的英语很差。谢谢你的帮助@“窗台”确保在处理旋转图像时搜索图像倾斜和校正。