如何使用python从目录中检测并分离损坏/不可读的PDF和受密码保护的PDF?
我有一个目录,包含大约100000多页PDF。 我想使用python将损坏/不可读和受密码保护的PDF从该目录中分离出来。 需要一个好的和快速的解决方案,因为我可能需要做大量的文件在未来它。 提前感谢。您可以尝试使用。使用如何使用python从目录中检测并分离损坏/不可读的PDF和受密码保护的PDF?,python,pdf,Python,Pdf,我有一个目录,包含大约100000多页PDF。 我想使用python将损坏/不可读和受密码保护的PDF从该目录中分离出来。 需要一个好的和快速的解决方案,因为我可能需要做大量的文件在未来它。 提前感谢。您可以尝试使用。使用os.listdir()循环目录中的所有文件,然后尝试打开每个文件,并存储每个文件的名称,其中会出现错误。您还可以将它们放在两个不同的目录中,具体取决于打开文件是否会导致错误,请使用您可以尝试使用的simpletry/except。使用os.listdir()循环目录中的所有文
os.listdir()
循环目录中的所有文件,然后尝试打开每个文件,并存储每个文件的名称,其中会出现错误。您还可以将它们放在两个不同的目录中,具体取决于打开文件是否会导致错误,请使用您可以尝试使用的simpletry/except
。使用os.listdir()
循环目录中的所有文件,然后尝试打开每个文件,并存储每个文件的名称,其中会出现错误。您还可以将它们放在两个不同的目录中,具体取决于使用simpletry/except
打开文件是否会导致错误