Python 无法读取文件并将其与我的代码一起使用
我正在使用以下模块:Python 无法读取文件并将其与我的代码一起使用,python,Python,我正在使用以下模块: from nltk.tokenize import word_tokenize from nltk.util import ngrams def makeNGrams(filename, n): variable_NGrams = ngrams(word_tokenize(filename), n) return [' '.join(grams) for grams in variable_NGrams] 只要输入我想处理的文本就行了,但是导入文本文件就行不通了
from nltk.tokenize import word_tokenize
from nltk.util import ngrams
def makeNGrams(filename, n):
variable_NGrams = ngrams(word_tokenize(filename), n)
return [' '.join(grams) for grams in variable_NGrams]
只要输入我想处理的文本就行了,但是导入文本文件就行不通了
当我这样写模块的时候
from nltk.tokenize import word_tokenize
from nltk.util import ngrams
def makeNGrams(filename, n):
text = open(filename, 'r').read()
variable_NGrams = ngrams(word_tokenize(text), n)
return [' '.join(grams) for grams in variable_NGrams]
用它打开一个特定的txt文件,我会收到大量的错误
如何在本模块中导入和使用文本文件?您有两个问题之一。您的文件名要么是全名,不需要附加
.txt
,要么不包含正确的文件扩展名,需要正确添加
备选案文1:
def makeNGrams(filename, n):
# Note the difference here
text = open(filename, 'r').read()
variable_NGrams = ngrams(word_tokenize(text), n)
return [' '.join(grams) for grams in variable_NGrams]
备选案文2:
def makeNGrams(filename, n):
# Note the difference here
text = open('{}.txt'.format(filename), 'r').read()
variable_NGrams = ngrams(word_tokenize(text), n)
return [' '.join(grams) for grams in variable_NGrams]
打开文件时最好使用“尝试除块”。这样更容易发现错误 导入pprint 尝试: 例外情况除外,如e:
pprint.pprint(e)
FileNotFoundError(2,‘没有这样的文件或目录’)在这里发布大量错误,我们可以更好地帮助您!好吧,我修正了它,这是一个愚蠢的错误:(我有一个.txt太多了)第一个选择是-我添加了一个.txt,并且在一个小时内没有意识到这一点
pprint.pprint(e)