在Python上使用Tesseract OCR时出现的问题

在Python上使用Tesseract OCR时出现的问题,python,anaconda,tesseract,Python,Anaconda,Tesseract,我是编程新手,我正尝试使用Tesseract OCR来读取图像的文本,但我无法让它工作!我在我的环境中安装了tesseract_OCR、Pyteseract和枕头。有人给小费吗 输入: from PIL import Image import pytesseract print( pytesseract.image_to_string( Image.open('phrase.jpg') ) ) 输出: C:\Anaconda2\envs\ambiente36\python.exe

我是编程新手,我正尝试使用Tesseract OCR来读取图像的文本,但我无法让它工作!我在我的环境中安装了tesseract_OCR、Pyteseract和枕头。有人给小费吗

输入:

from PIL import Image 

import pytesseract

print( pytesseract.image_to_string( Image.open('phrase.jpg') ) ) 
输出:

 C:\Anaconda2\envs\ambiente36\python.exe 

 C:/Users/Simone/Desktop/curso_programacao/Ler_imagens/ler_imagens

Traceback (most recent call last):

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 194, in run_and_get_output
run_tesseract(**kwargs)

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 165, in run_tesseract
proc = subprocess.Popen(command, **subprocess_args())

File "C:\Anaconda2\envs\ambiente36\lib\subprocess.py", line 709, in __init__
restore_signals, start_new_session)

File "C:\Anaconda2\envs\ambiente36\lib\subprocess.py", line 997, in 
_execute_child 
startupinfo)

FileNotFoundError: [WinError 2] O sistema não pode encontrar o arquivo 
especificado

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "C:/Users/Simone/Desktop/curso_programacao/Ler_imagens/ler_imagens", 
line 6, in <module>
phrase = pytesseract.image_to_string(Image.open('phrase.jpg'))

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 286, in image_to_string
return run_and_get_output(image, 'txt', lang, config, nice)

File "C:\Anaconda2\envs\ambiente36\lib\site- 
packages\pytesseract\pytesseract.py", line 201, in run_and_get_output
raise TesseractNotFoundError()

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed 
or it's not in your path
C:\Anaconda2\envs\ambiente36\python.exe
C:/Users/Simone/Desktop/curso_程序acao/Ler_图像/Ler_图像
回溯(最近一次呼叫最后一次):
文件“C:\Anaconda2\envs\ambiente36\lib\site-
packages\pytesseract\pytesseract.py”,第194行,在运行和获取输出中
运行_tesseract(**kwargs)
文件“C:\Anaconda2\envs\ambiente36\lib\site-
packages\pytesseract\pytesseract.py”,第165行,在run\u tesseract中
proc=subprocess.Popen(命令,**subprocess_args())
文件“C:\Anaconda2\envs\ambiente36\lib\subprocess.py”,第709行,在\uuu init中__
恢复信号,启动新会话)
文件“C:\Anaconda2\envs\ambiente36\lib\subprocess.py”,第997行,在
_处死孩子
startupinfo)
FileNotFoundError:[WinError 2]O系统
特别的
在处理上述异常期间,发生了另一个异常:
回溯(最近一次呼叫最后一次):
文件“C:/Users/Simone/Desktop/curso_programacao/Ler_imagens/Ler_imagens”,
第6行,在
phrase=pytesseract.image_to_字符串(image.open('phrase.jpg'))
文件“C:\Anaconda2\envs\ambiente36\lib\site-
packages\pytesseract\pytesseract.py”,第286行,在图像\u到\u字符串中
返回run_和get_输出(图像,'txt',lang,config,nice)
文件“C:\Anaconda2\envs\ambiente36\lib\site-
packages\pytesseract\pytesseract.py”,第201行,在运行和获取输出中
引发TesseractNotFoundError()
PyteseRact.PyteseRact.TesseractNotFoundError:未安装tesseract
或者它不在你的道路上

在环境中配置tessaract时应遵循的步骤 以下是您应该遵循的步骤

首先安装python和pip是以下步骤 然后安装枕头,如图所示

pytessaract的链接
您可以找到一个完整的示例

可能是Tesseract未正确安装,或者到Tesseract的路径未指向Tesseract的实际安装位置

pytesseract.pytesseract.TesseractNotFoundError:tesseract不是 已安装或不在您的路径中

我建议您首先通过以下方式检查您的安装

我最近写了一个非常简单的Tesseract指南,但它应该可以让您编写第一个OCR脚本,并清除我在文档中没有我希望的那么清晰时遇到的一些障碍

如果您想查看,我在这里与您共享以下链接:


您需要使用可用的windows installer安装tesseract。然后,您应该将python包装器安装为:

pip install pytesseract
然后,在导入pytesseract库后,还应在脚本中设置tesseract路径,如下所示(请不要忘记,在您的情况下,安装路径可能会被修改!):


注意:它在Anaconda3上测试没有任何问题。

您的图像文件与脚本在同一文件夹中吗?是的,它在同一文件夹中。OP似乎使用python 3So,这意味着我不能将anaconda环境用于Tesseract OCR,我需要通过安装python和pip来创建一个新环境?如果你已经正确安装了anaconda python,你就不需要安装PIL。。您只需运行上面的示例如果您已经安装了python anaconda,则下载下面的zip并将其解压缩到上面代码所在的同一目录中,然后运行示例
pip install pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'