在python中从pdf文件对象提取文本

在python中从pdf文件对象提取文本,python,file,pdf,Python,File,Pdf,例如,我们可以从请求收集的pdf文件对象中提取文本吗 f = request.FILES.get('file', None) 因此,当我们从文本文件对象获取文本内容时,可以从f中提取文档文本。尝试使用名为textract的库 它支持多种格式,包括PDF import textract text = textract.process("path/to/file.extension") 谢谢你回答我的问题,但我想从文件对象而不是文件中提取文本。

例如,我们可以从请求收集的pdf文件对象中提取文本吗

f = request.FILES.get('file', None)

因此,当我们从文本文件对象获取文本内容时,可以从
f
中提取文档文本。

尝试使用名为textract的库

它支持多种格式,包括PDF

import textract
text = textract.process("path/to/file.extension")

谢谢你回答我的问题,但我想从文件对象而不是文件中提取文本。