Python UnicodeDecodeError:&x27;utf8';编解码器可以';t解码字节0xfc:无效的开始字节

Python UnicodeDecodeError:&x27;utf8';编解码器可以';t解码字节0xfc:无效的开始字节,python,utf-8,character-encoding,ascii,Python,Utf 8,Character Encoding,Ascii,我在执行分析csv文件中文本的脚本时遇到以下错误 这个句子包含德语字符,如é和ü。看起来Python正在向这些角色倾斜。我尝试过将ascii编码改为utf-8编码,但这并没有真正起到作用 我的Python脚本: import csv from textblob import TextBlob infile = 'C:\Python27\file.csv' with open(infile, 'rb') as csvfile: rows = csv.r

我在执行分析csv文件中文本的脚本时遇到以下错误

这个句子包含德语字符,如é和ü。看起来Python正在向这些角色倾斜。我尝试过将ascii编码改为utf-8编码,但这并没有真正起到作用

我的Python脚本:

    import csv
    from textblob import TextBlob

    infile = 'C:\Python27\file.csv'

    with open(infile, 'rb') as csvfile:
     rows = csv.reader(csvfile)
     for row in rows:
      sentence = row[4]
      blob = TextBlob(sentence)
      print sentence
      print blob.sentiment.polarity, blob.sentiment.subjectivity

(如果有人能解释如何将结果输出到csv文件,我们将不胜感激。)

显示有问题的数据。查看故障排除信息,并将您的问题转化为a。但从间接证据来看,我猜该文件是用
拉丁语-1
编码的,而不是
utf-8
。似乎要破译“oops.Sorry…@o2de biteübernehmen Danke!”这句话了错误消息是:UnicodeDecodeError:“utf8”编解码器无法解码位置28处的字节0xfc:无效的起始字节。顺便说一句,您肯定应该很快切换到Python 3。按照最初的时间表,Vesrion2本应在今年早些时候结束生命(尽管它得到了延期,现在处于长期的临终关怀中)。Py3在这方面带来了一些变化,总体上是向好的方向发展;虽然您也希望在数据文件中摆脱传统的8位编码,以获得充分的好处。同样在Windows上,您可能应该使用
r'raw strings'
作为带有反斜杠的文件路径。