Python 如何让docx2txt处理目录中的所有docx文件?
我正在使用python2.7中的docx2txt模块,并试图让它在一个目录中处理所有docx文件。目前我有doc2text.process(“DOCUMENT.docx的名称”) 我想处理当前工作目录中的所有docx文件,但不确定如何处理 我在下面插入了我的代码。它打印出文件名和docx文件中的文本Python 如何让docx2txt处理目录中的所有docx文件?,python,docx,Python,Docx,我正在使用python2.7中的docx2txt模块,并试图让它在一个目录中处理所有docx文件。目前我有doc2text.process(“DOCUMENT.docx的名称”) 我想处理当前工作目录中的所有docx文件,但不确定如何处理 我在下面插入了我的代码。它打印出文件名和docx文件中的文本 import os import docx2txt os.chdir('c:/users/Says/desktop') files = [] path = 'c:/users/Says/des
import os
import docx2txt
os.chdir('c:/users/Says/desktop')
files = []
path = 'c:/users/Says/desktop'
my_text = docx2txt.process("test.docx")
for files in os.listdir(path):
if files.endswith('docx'):
print(files)
print(my_text)
你已经走到一半了
创建一个列表以存储找到的所有文件:
files = []
for file in os.listdir(path):
if file.endswith('.docx'):
files.append(file)
然后,您可以使用for
语句循环浏览所有文件,并一次打开一个文件:
for i in range(len(files)):
text = docx2txt.process(files[i])
# Do something with the text.
如果要更改代码以允许使用当前工作目录,可以将路径设置为:
path = os.getcwd()
你到底想实现什么?我最终想创建一个搜索功能。因此,用户可以输入一个单词,然后python脚本将读取目录中的所有docx文件,并告诉我哪些文件具有该单词谢谢!我正在尝试向“对文本部分执行某些操作”添加代码,但我似乎要么得到“使用退出代码0完成处理”,要么得到一个空列表“[]”,因为输出处理文件的方式由您决定。你问的是如何从文件中获取文本-我的回答告诉你了。如果列表为空,则在指定路径中没有以“.docx”结尾的文件。另一方面,听起来您真的想开始探索关键字参数或gui,以便将一个词传递给您的程序,然后您可以使用它来处理您的文件。process finished(处理完成)只是意味着python已经完成了您的脚本的执行,并且无事可做,因此它停止运行。在这种情况下,如果希望在脚本完成后保持解释器打开,可以运行
python-i file.py
()谢谢@Ninetails:)