将包含10k.txt文件的文件夹转换为数组(python)的最快方法是什么

将包含10k.txt文件的文件夹转换为数组(python)的最快方法是什么,python,Python,方式:文件夹中文件的方式数组 这要花很多时间(1小时),你能帮我把它弄快一点吗 此代码运行速度更快。对于初学者,请删除print(f.read())打印需要很长时间。此外,它还会破坏您的代码,因为这甚至不起作用,因为您读取了要打印的整个文件对象,然后再次尝试读取以追加,但是。read()第二次将始终返回空字符串。此外,这不是数组,而是列表。首先,删除打印。接下来,使用with语句,而不是手动打开和关闭文件。我不知道这是否会对速度产生影响,但至少这是更好的练习。顺便说一句,欢迎来到SO!如果需要建

方式:文件夹中文件的方式数组

这要花很多时间(1小时),你能帮我把它弄快一点吗


此代码运行速度更快。

对于初学者,请删除
print(f.read())
打印需要很长时间。此外,它还会破坏您的代码,因为这甚至不起作用,因为您读取了要打印的整个文件对象,然后再次尝试读取以追加,但是
。read()
第二次将始终返回空字符串。此外,这不是数组,而是列表。首先,删除
打印
。接下来,使用
with
语句,而不是手动打开和关闭文件。我不知道这是否会对速度产生影响,但至少这是更好的练习。顺便说一句,欢迎来到SO!如果需要建议,请查看和。您还可以使用多处理来映射函数。它将使用多个核心,而不是单个核心
corpus = []
for i in tqdm(ways):
  f = open(i,'r')
  print(f.read())
  corpus.append(preprocess_text(f.read()))
  f.close()
corpus = [] 
for i in tqdm(ways):    
    with open(i, 'r') as f:       
        corpus.append(preprocess_text(f.read()))