PythonTextract表单URL

PythonTextract表单URL,python,pdf,text-extraction,Python,Pdf,Text Extraction,我在web服务器上使用python作为API的一部分。我想发布一个带有url的url到服务器,并让textract从该url中提取文本(例如) 当我尝试发布时,我得到一个502代理错误的响应,我的python日志显示 textract.exceptions.MissingFileError:找不到文件“” 这是因为Textract无法从远程文件中提取,如果是,是否有解决方法 谢谢 Textract是否意味着可以从网站下载?我想你必须首先感谢Peter,我认为Textract只能处理本地文件,ur

我在web服务器上使用python作为API的一部分。我想发布一个带有url的url到服务器,并让textract从该url中提取文本(例如)

当我尝试发布时,我得到一个502代理错误的响应,我的python日志显示

textract.exceptions.MissingFileError:找不到文件“”

这是因为Textract无法从远程文件中提取,如果是,是否有解决方法


谢谢

Textract是否意味着可以从网站下载?我想你必须首先感谢Peter,我认为Textract只能处理本地文件,urllib为我指明了正确的方向。我将用我的代码添加一个答案。