Python 从类型为'；的图像中提取文本时出错；PpmImagePlugin.PpmImageFile'；使用pytesseract_Python_Python Tesseract

Python 从类型为'；的图像中提取文本时出错；PpmImagePlugin.PpmImageFile'；使用pytesseract

python

Python 从类型为'；的图像中提取文本时出错；PpmImagePlugin.PpmImageFile'；使用pytesseract,python,python-tesseract,Python,Python Tesseract,正在尝试使用pytesseract从类型为'PIL.PpmImagePlugin.PpmImageFile'的图像中提取文本。代码和错误如下所示从pdf2image导入从路径转换 pages=convert_from_path（'D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf'，poppler_path='C:/Users/Hp/poppler-0.68.0/bin'）） text=pyt.image\u to\u

正在尝试使用

pytesseract

从类型为

'PIL.PpmImagePlugin.PpmImageFile'

的图像中提取文本。代码和错误如下所示

从pdf2image导入从路径转换
pages=convert_from_path（'D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf'，poppler_path='C:/Users/Hp/poppler-0.68.0/bin'））
text=pyt.image\u to\u字符串（image.open（第[0]页），lang='eng'）

我得到的错误是：

AttributeError:'PpmImageFile'对象没有属性'read'

或者是否有任何方法将PpmImageFile转换为“jpg”或“png”格式

将

fmt='jpeg'

或

fmt='png'

添加到函数调用中，以从pdf2image获取非PPM图像

在你的例子中，改变

pages = convert_from_path('D:/pdf_csv/Health....001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')

到

请出示你的密码。

pages = convert_from_path('D:/pdf_csv/Health...001468,69,70.pdf', fmt='jpeg', poppler_path='C:/Users/Hp/poppler-0.68.0/bin')