Python:如何在代码中包含多个文本文件?
我正在windows上使用Python3。如何包含多个文本文件,以便可以使用多个文件运行代码Python:如何在代码中包含多个文本文件?,python,text-files,Python,Text Files,我正在windows上使用Python3。如何包含多个文本文件,以便可以使用多个文件运行代码 article_one = re.findall('\w+', open('D.txt',).read().lower()) wordbank = {} for word in article_one: word = word.lower().strip(string.punctuation) if word not in wordbank: wordbank[word
article_one = re.findall('\w+', open('D.txt',).read().lower())
wordbank = {}
for word in article_one:
word = word.lower().strip(string.punctuation)
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))
for word in sortedwords:
print (word[1], word[0])
可以使用“glob”库获取与表达式(即*.txt)匹配的所有文件的数组。一旦你有了这个数组,你就可以遍历它,一个接一个地打开每个文件,然后执行你想做的步骤
我想您可以在执行正则表达式之前将文件连接在一起,或者只是循环遍历文件。您还可以使用字典获取
单词
列表中的单词频率
from collections import Counter
words = []
for filename in ['A.txt', 'D.txt']:
with open(filename, 'r') as f:
words.extend(re.findall('\w+', f.read().lower()))
wordbank = Counter(words)
for word, cnt in wordbank.most_common():
print word, cnt
诸如此类:
在本例中,您可以根据需要创建文件列表-可以使用glob或任何其他方式。如果您需要帮助,请告知您的创建标准
filelist = ['D.txt','E.txt']
wordbank = {}
for file in filelist:
article_one = re.findall('\w+', open(file,).read().lower())
for word in article_one:
word = word.lower().strip(string.punctuation)
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))
for word in sortedwords:
print (word[1], word[0])
你的文件是什么格式的?