Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/340.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用NLTK python读取文件_Python_Nltk - Fatal编程技术网

用NLTK python读取文件

用NLTK python读取文件,python,nltk,Python,Nltk,我正在尝试使用nltk读取一个txt文件,下面是代码,我是nltk新手,因此不确定它的工作原理,但我遇到了一个错误,请各位说明错误是由于文本文件或代码的某些问题造成的。请在下面查找代码和错误消息。提前谢谢你的帮助 代码- 错误- Traceback (most recent call last): File "G:/DSTI/python/txt.py", line 4, in <module> raw=f.read() File "C:\Users\Pratik\A

我正在尝试使用nltk读取一个txt文件,下面是代码,我是nltk新手,因此不确定它的工作原理,但我遇到了一个错误,请各位说明错误是由于文本文件或代码的某些问题造成的。请在下面查找代码和错误消息。提前谢谢你的帮助

代码-

错误-

Traceback (most recent call last):
  File "G:/DSTI/python/txt.py", line 4, in <module>
    raw=f.read()
  File "C:\Users\Pratik\AppData\Local\Programs\Python\Python36-32\lib\encodings\cp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 7237: character maps to <undefined>
回溯(最近一次呼叫最后一次):
文件“G:/DSTI/python/txt.py”,第4行,在
raw=f.read()
文件“C:\Users\Pratik\AppData\Local\Programs\Python\Python36-32\lib\encodings\cp1252.py”,第23行,解码
返回编解码器.charmap\u解码(输入、自身错误、解码表)[0]
UnicodeDecodeError:“charmap”编解码器无法解码位置7237中的字节0x9d:字符映射到

您的问题在于
open()
,它与nltk无关。您需要为文件提供正确的编码,例如
open(“MobyDick.txt”,encoding=“latin1”)
您的问题在于
open()
,它与nltk无关。您需要为文件提供正确的编码,例如
open(“MobyDick.txt”,encoding=“latin1”)
Traceback (most recent call last):
  File "G:/DSTI/python/txt.py", line 4, in <module>
    raw=f.read()
  File "C:\Users\Pratik\AppData\Local\Programs\Python\Python36-32\lib\encodings\cp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 7237: character maps to <undefined>