Python 从类型为';的图像中提取文本时出错;PpmImagePlugin.PpmImageFile';使用pytesseract
正在尝试使用Python 从类型为';的图像中提取文本时出错;PpmImagePlugin.PpmImageFile';使用pytesseract,python,python-tesseract,Python,Python Tesseract,正在尝试使用pytesseract从类型为'PIL.PpmImagePlugin.PpmImageFile'的图像中提取文本。代码和错误如下所示 从pdf2image导入从路径转换 pages=convert_from_path('D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')) text=pyt.image\u to\u
pytesseract
从类型为'PIL.PpmImagePlugin.PpmImageFile'
的图像中提取文本。代码和错误如下所示
从pdf2image导入从路径转换
pages=convert_from_path('D:/pdf_csv/HealthCare/eRDS-ML/eRDS-ML/2001468/2001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin'))
text=pyt.image\u to\u字符串(image.open(第[0]页),lang='eng')
我得到的错误是:
AttributeError:'PpmImageFile'对象没有属性'read'
或者是否有任何方法将PpmImageFile转换为“jpg”或“png”格式将
fmt='jpeg'
或fmt='png'
添加到函数调用中,以从pdf2image获取非PPM图像
在你的例子中,改变
pages = convert_from_path('D:/pdf_csv/Health....001468,69,70.pdf',poppler_path='C:/Users/Hp/poppler-0.68.0/bin')
到
请出示你的密码。
pages = convert_from_path('D:/pdf_csv/Health...001468,69,70.pdf', fmt='jpeg', poppler_path='C:/Users/Hp/poppler-0.68.0/bin')