Python 3.x 错误UnicodeDecodeError:&x27；utf-8'；读取CSV时的编解码器_Python 3.x

Python 3.x 错误UnicodeDecodeError:&x27；utf-8'；读取CSV时的编解码器

python-3.x

Python 3.x 错误UnicodeDecodeError:&x27；utf-8'；读取CSV时的编解码器,python-3.x,Python 3.x,我最近从PISA下载了PISA 2012学生数据库。我按照说明在SAS上成功地阅读了它。然后我使用proc export导出为CSV以在Python3中读取它，但在Python pandas:UnicodeDecodeError中尝试读取它时，我一直遇到此错误：“utf-8”编解码器无法解码位置24:无效起始字节中的字节0xc1。我能做什么 pisa2012\u Col=pd.read\u csv（'Pisasubset2012Col.csv'）尝试使用 pisa2012_Col=pd.read

我最近从PISA下载了PISA 2012学生数据库。我按照说明在SAS上成功地阅读了它。然后我使用proc export导出为CSV以在Python3中读取它，但在Python pandas:UnicodeDecodeError中尝试读取它时，我一直遇到此错误：“utf-8”编解码器无法解码位置24:无效起始字节中的字节0xc1。我能做什么

pisa2012\u Col=pd.read\u csv（'Pisasubset2012Col.csv'）

尝试使用

pisa2012_Col=pd.read_csv('Pisasubset2012Col.csv', encoding = "ISO-8859-1")

由于

read\u csv

有一个编码选项来处理不同格式的文件（请参阅）

尝试使用

pisa2012_Col=pd.read_csv('Pisasubset2012Col.csv', encoding = "ISO-8859-1")

因为

read\u csv

有一个编码选项来处理不同格式的文件（请参阅）

谢谢你们。它似乎起作用了。我成功地阅读了它，直到知道为止，变量对我的计算反应良好。似乎解决了。

谢谢你们两位。它似乎起作用了。我成功地阅读了它，直到知道为止，变量对我的计算反应良好。似乎已解决。

为什么您认为该文件使用ISO-8859-1编码？该文件的数据编码肯定很糟糕。从错误消息中的0xc1开始，我认为

拉丁语1

将完成这里的工作

ISO-8859-1

或

Latin_1

是8位字符集，因此所有垃圾都有一个有效值。为什么您认为该文件是用ISO-8859-1编码的？该文件肯定是编码错误的数据。从错误消息中的0xc1开始，我认为

拉丁语1

将完成这里的工作

ISO-8859-1

或

Latin_1

是8位字符集，因此所有垃圾都有一个有效值。