Python 读取或保存上载到Flask的PDF文件
我使用表单将多个文件上传到flask,我在flask后端获取文件对象没有问题,但问题是我想读取PDF文件以从中提取文本。我无法对从表单收到的文件对象执行此操作,我想到的另一种方法是将文件保存在本地存储器中,然后在使用file.save(路径,文件名)执行此操作时再次读取。它创建了一个名为-filename.pdf的空文本文件Python 读取或保存上载到Flask的PDF文件,python,flask,form-data,pypdf2,python-os,Python,Flask,Form Data,Pypdf2,Python Os,我使用表单将多个文件上传到flask,我在flask后端获取文件对象没有问题,但问题是我想读取PDF文件以从中提取文本。我无法对从表单收到的文件对象执行此操作,我想到的另一种方法是将文件保存在本地存储器中,然后在使用file.save(路径,文件名)执行此操作时再次读取。它创建了一个名为-filename.pdf的空文本文件 app=Flask(__name__) @app.route('/') def index(): return ''' <form met
app=Flask(__name__)
@app.route('/')
def index():
return '''
<form method='POST' action='/saveData'>
<input type='file' name='testReport'>
<input type='submit'>
</form>
'''
@app.route('/saveData', methods=['POST'])
def saveData():
if 'testReport' in request.files:
testReport= request.files['testReport']
#This isn't working, a text file is saved with the same name ,ending in pdf
testReport.save(os.path.join(app.config['UPLOAD_FOLDER'], testReport.filename))
return f'<h1>File saved {testReport.filename}</h1>'
else:
return 'Not done'
app=Flask(\uuuuu name\uuuuuu)
@应用程序路径(“/”)
def index():
返回“”'
'''
@app.route('/saveData',methods=['POST'])
def saveData():
如果request.file中有“testReport”:
testReport=request.files['testReport']
#这不起作用,一个文本文件以相同的名称保存,以pdf结尾
保存(os.path.join(app.config['UPLOAD_FOLDER'],testReport.filename))
返回f'File saved{testReport.filename}'
其他:
返回“未完成”
上传到flask后,我们如何操作PDF文件?上传到flask后,我们如何操作PDF文件
你们应该像对待普通的PDF文件一样对待它们——若它们是通过Flask应用程序上传的,或者是使用其他方法收集的,那个么在这里就无关紧要了。像你一样
要读取PDF文件以从中提取文本
例如,您应该使用PDF文本提取工具,因为这是一个外部模块,您需要先安装它:
pip安装pdfminer.six
您可以直接按照前面提到的方法[]
这很容易与PDF一起使用。只是别忘了在允许的扩展中包含您的扩展名有没有办法在我的电脑中保存PDF?@ShashankPrasad根据
表单
应将enctype
设置为多部分/表单数据
(