在python中从pdf文件对象提取文本_Python_File_Pdf

在python中从pdf文件对象提取文本

python file pdf

在python中从pdf文件对象提取文本,python,file,pdf,Python,File,Pdf,例如，我们可以从请求收集的pdf文件对象中提取文本吗 f = request.FILES.get('file', None) 因此，当我们从文本文件对象获取文本内容时，可以从f中提取文档文本。尝试使用名为textract的库它支持多种格式，包括PDF import textract text = textract.process("path/to/file.extension") 谢谢你回答我的问题，但我想从文件对象而不是文件中提取文本。

例如，我们可以从请求收集的pdf文件对象中提取文本吗

f = request.FILES.get('file', None)

因此，当我们从文本文件对象获取文本内容时，可以从

中提取文档文本。

尝试使用名为textract的库

它支持多种格式，包括PDF

import textract
text = textract.process("path/to/file.extension")

谢谢你回答我的问题，但我想从文件对象而不是文件中提取文本。