python nltk.sent_令牌化错误ascii编解码器可以';破译

python nltk.sent_令牌化错误ascii编解码器可以';破译,python,nltk,Python,Nltk,我可以成功地将文本读入变量,但在尝试标记文本时,我遇到了一个奇怪的错误: sentences=nltk.sent_tokenize(sample) UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 11: ordinal not in range(128) 我知道错误的原因是一些特殊的字符串/字符,标记器无法读取/解码,但如何绕过它? 谢谢简而言之,NLTK3的pos_标签功能不起作用 但是,NLTK2函数

我可以成功地将文本读入变量,但在尝试标记文本时,我遇到了一个奇怪的错误:

sentences=nltk.sent_tokenize(sample)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 11: ordinal not in range(128)
我知道错误的原因是一些特殊的字符串/字符,标记器无法读取/解码,但如何绕过它?
谢谢

简而言之,NLTK3的pos_标签功能不起作用

但是,NLTK2函数工作正常

pip卸载nltk

pip安装

另一方面,tagger非常糟糕(显然,“温室”是一个动词)。我希望斯帕西能在窗户上工作