Python 从txt文件中标记句子，并获取；应为字符串或字节，如“object”；错误_Python_Nltk_Tokenize

Python 从txt文件中标记句子，并获取；应为字符串或字节，如“object”；错误

python

Python 从txt文件中标记句子，并获取；应为字符串或字节，如“object”；错误,python,nltk,tokenize,Python,Nltk,Tokenize,我想我有一个非常简单的代码来打开一个文件，阅读它，并把它标记成句子 import nltk text = open('1865-Lincoln.txt', 'r') tokens = nltk.sent_tokenize(text) print(tokens) 但我一直在犯一个疯狂的长期错误 TypeError: expected string or bytes-like object 您需要在open和token之间使用read命令 fileObj = open('1865-Lincoln

我想我有一个非常简单的代码来打开一个文件，阅读它，并把它标记成句子

import nltk
text = open('1865-Lincoln.txt', 'r')
tokens = nltk.sent_tokenize(text)
print(tokens)

但我一直在犯一个疯狂的长期错误

TypeError: expected string or bytes-like object

您需要在open和token之间使用read命令

fileObj = open('1865-Lincoln.txt', 'r')
text = fileObj.read()

您需要在open和token之间使用read命令

fileObj = open('1865-Lincoln.txt', 'r')
text = fileObj.read()

您只是打开文本文件，没有读取相同的内容，这意味着同一文件的内容不会被记录为字符串，而且您只是将文件传递给nltk以标记句子，这只有在为nltk提供字符串类型输入时才可能。希望你能理解。谢谢：）

您需要调用

read（）

函数，以便在以后从文件中读取内容。它将允许通过

nltk.sent\u tokenize

包标记您的句子。重新生成代码，如下所示：

import nltk
filex = open('1865-Lincoln.txt', 'r')
text = filex.read()
tokens = nltk.sent_tokenize(text)
print(tokens)

您需要调用

read（）

函数，以便在以后从文件中读取内容。它将允许通过

nltk.sent\u tokenize

包标记您的句子。重新生成代码，如下所示：

import nltk
filex = open('1865-Lincoln.txt', 'r')
text = filex.read()
tokens = nltk.sent_tokenize(text)
print(tokens)