如何使用python从目录中检测并分离损坏/不可读的PDF和受密码保护的PDF？_Python_Pdf

如何使用python从目录中检测并分离损坏/不可读的PDF和受密码保护的PDF？

python pdf

如何使用python从目录中检测并分离损坏/不可读的PDF和受密码保护的PDF？,python,pdf,Python,Pdf,我有一个目录，包含大约100000多页PDF。我想使用python将损坏/不可读和受密码保护的PDF从该目录中分离出来。需要一个好的和快速的解决方案，因为我可能需要做大量的文件在未来它。提前感谢。您可以尝试使用。使用os.listdir（）循环目录中的所有文件，然后尝试打开每个文件，并存储每个文件的名称，其中会出现错误。您还可以将它们放在两个不同的目录中，具体取决于打开文件是否会导致错误，请使用您可以尝试使用的simpletry/except。使用os.listdir（）循环目录中的所有文

我有一个目录，包含大约100000多页PDF。我想使用python将损坏/不可读和受密码保护的PDF从该目录中分离出来。需要一个好的和快速的解决方案，因为我可能需要做大量的文件在未来它。提前感谢。

您可以尝试使用。使用

os.listdir（）

循环目录中的所有文件，然后尝试打开每个文件，并存储每个文件的名称，其中会出现错误。您还可以将它们放在两个不同的目录中，具体取决于打开文件是否会导致错误，请使用您可以尝试使用的simple

try/except

。使用

os.listdir（）

循环目录中的所有文件，然后尝试打开每个文件，并存储每个文件的名称，其中会出现错误。您还可以将它们放在两个不同的目录中，具体取决于使用simple

try/except

打开文件是否会导致错误