检测和删除损坏的PDF

检测和删除损坏的PDF,pdf,corrupt,Pdf,Corrupt,如何检测损坏的PDF(使用python) 我有很多PDF文件。其中一些PDF已损坏,应删除。如何检测和删除 我用过: from pyPdf import PdfFileReader try : mypdf = PdfFileReader(file( 'sample.pdf', 'rb')) except: print ' is invalid pdf' 但是,如何从文件中自动读取PDF并删除损坏的PDF呢?Adobe Reader实际上包含许多自动修复功能,因此它将打开

如何检测损坏的PDF(使用python)

我有很多PDF文件。其中一些PDF已损坏,应删除。如何检测和删除

我用过:

 from pyPdf import PdfFileReader

try :
     mypdf = PdfFileReader(file( 'sample.pdf', 'rb'))
except:
     print ' is invalid pdf'

但是,如何从文件中自动读取PDF并删除损坏的PDF呢?

Adobe Reader实际上包含许多自动修复功能,因此它将打开大量损坏的PDF文件。

如果Adobe Reader无法读取“损坏的PDF”术语,您能否澄清其含义?似乎您已经知道如何检测它。您所需要的只是迭代文件和删除文件。是吗?是的,我如何读取所有pdf文件的名称并删除其损坏?是的,当然,但下载的pdf文件不完整且无法修复。然后检查它在最后1024字节中是否有%%EOF