是否有python模块可以读取pdf并将其转换为文本

是否有python模块可以读取pdf并将其转换为文本,python,pdf,module,Python,Pdf,Module,我指的是一个扫描图像或类似的东西,并将其转换为文本,或者有什么方法可以做到这一点 编辑:顺便说一句,这不是复制品,我想知道我是否可以从扫描图像中提取文本,不是一个普通的PDF,Tesseract OCR的包装可用,请尝试PDFminer,它可能适合您的需要 搜索“python字符识别”引号

我指的是一个扫描图像或类似的东西,并将其转换为文本,或者有什么方法可以做到这一点


编辑:顺便说一句,这不是复制品,我想知道我是否可以从扫描图像中提取文本,不是一个普通的PDF,Tesseract OCR的包装可用,请尝试PDFminer,它可能适合您的需要

搜索“python字符识别”引号