Python 从类型为';的图像中提取文本时出错;PpmImagePlugin.PpmImageFile';使用pytesseract

Python 从类型为';的图像中提取文本时出错;PpmImagePlugin.PpmImageFile';使用pytesseract,python,python-tesseract,Python,Python Tesseract,正在尝试使用pytesseract从类型为'PIL.PpmImagePlugin.PpmImageFile'的图像中提取文本。代码和错误如下所示 从pdf2image导入从路径转换 pages=convert_from_path('D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')) text=pyt.image\u to\u

正在尝试使用
pytesseract
从类型为
'PIL.PpmImagePlugin.PpmImageFile'
的图像中提取文本。代码和错误如下所示

从pdf2image导入从路径转换
pages=convert_from_path('D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin'))
text=pyt.image\u to\u字符串(image.open(第[0]页),lang='eng')
我得到的错误是:

AttributeError:'PpmImageFile'对象没有属性'read'

或者是否有任何方法将PpmImageFile转换为“jpg”或“png”格式

fmt='jpeg'
fmt='png'
添加到函数调用中,以从pdf2image获取非PPM图像

在你的例子中,改变

pages = convert_from_path('D:/pdf_csv/Health....001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')


请出示你的密码。
pages = convert_from_path('D:/pdf_csv/Health...001468,69,70.pdf', fmt='jpeg', poppler_path='C:/Users/Hp/poppler-0.68.0/bin')