Python 从txt文件中标记句子,并获取;应为字符串或字节,如“object”;错误
我想我有一个非常简单的代码来打开一个文件,阅读它,并把它标记成句子Python 从txt文件中标记句子,并获取;应为字符串或字节,如“object”;错误,python,nltk,tokenize,Python,Nltk,Tokenize,我想我有一个非常简单的代码来打开一个文件,阅读它,并把它标记成句子 import nltk text = open('1865-Lincoln.txt', 'r') tokens = nltk.sent_tokenize(text) print(tokens) 但我一直在犯一个疯狂的长期错误 TypeError: expected string or bytes-like object 您需要在open和token之间使用read命令 fileObj = open('1865-Lincoln
import nltk
text = open('1865-Lincoln.txt', 'r')
tokens = nltk.sent_tokenize(text)
print(tokens)
但我一直在犯一个疯狂的长期错误
TypeError: expected string or bytes-like object
您需要在open和token之间使用read命令
fileObj = open('1865-Lincoln.txt', 'r')
text = fileObj.read()
您需要在open和token之间使用read命令
fileObj = open('1865-Lincoln.txt', 'r')
text = fileObj.read()
您只是打开文本文件,没有读取相同的内容,这意味着同一文件的内容不会被记录为字符串,而且您只是将文件传递给nltk以标记句子,这只有在为nltk提供字符串类型输入时才可能。希望你能理解。谢谢:)您只是打开文本文件,没有读取相同的内容,这意味着同一文件的内容不会被记录为字符串,而且您只是将文件传递给nltk以标记句子,这只有在为nltk提供字符串类型输入时才可能。希望你能理解。谢谢:)您需要调用
read()
函数,以便在以后从文件中读取内容。它将允许通过nltk.sent\u tokenize
包标记您的句子。重新生成代码,如下所示:
import nltk
filex = open('1865-Lincoln.txt', 'r')
text = filex.read()
tokens = nltk.sent_tokenize(text)
print(tokens)
您需要调用
read()
函数,以便在以后从文件中读取内容。它将允许通过nltk.sent\u tokenize
包标记您的句子。重新生成代码,如下所示:
import nltk
filex = open('1865-Lincoln.txt', 'r')
text = filex.read()
tokens = nltk.sent_tokenize(text)
print(tokens)