Python脚本,用于对文件夹中的所有文件运行命令

Python脚本,用于对文件夹中的所有文件运行命令,python,pdf,text,data-analysis,pdfminer,Python,Pdf,Text,Data Analysis,Pdfminer,要将pdf转换为文本,我使用以下命令: pdf2txt.py-o text.txt example.pdf#它将example.pdf转换为text.txt 但我有1000多个pdf文件,我需要先转换成文本文件,然后再进行分析 是否有一种方法可以使用此命令迭代pdf文件并转换所有文件?我建议您使用shell脚本: for f (*.pdf) {pdf2txt.py -o $f $f.txt} 然后使用python读取所有.txt文件进行分析 仅使用python转换: from subproce

要将pdf转换为文本,我使用以下命令:

pdf2txt.py-o text.txt example.pdf#它将example.pdf转换为text.txt

但我有1000多个pdf文件,我需要先转换成文本文件,然后再进行分析


是否有一种方法可以使用此命令迭代pdf文件并转换所有文件?

我建议您使用shell脚本:

for f (*.pdf) {pdf2txt.py -o $f $f.txt}
然后使用python读取所有
.txt
文件进行分析

仅使用python转换:

from subprocess import call
import glob

for pdf_file in glob.glob('*.pdf'): 
    call(["pdf2txt.py", "-o", pdf_file, pdf_file[:-3]+"txt"])

python代码在我的win1o操作系统上出错(OSError:[WinError 193]%1不是有效的Win32应用程序),for循环应该是:

for pdf_file in glob.glob('*.pdf'):
    call(['python.exe','pdf2txt.py','-o',pdf_file[:-3]+'txt',pdf_file])
注意,文件i/o的参数是相反的,如果您保持相同的顺序,您的文件将被空文件覆盖


还是要感谢古鲁巴德·赫格德,告诉我隐藏文件的方法,这很有帮助

由于我使用的是windows,我可以在Python脚本中实现同样的功能吗?-o用于输出,而不是相反,正确的代码:对于f(*.pdf){pdf2txt.py$f-o$f.txt}
for%I in(*.pdf)do pdf2txt.py-o%~ni.txt%I
in应该在windows的命令行中执行您想要的操作。