Python 3.x 错误UnicodeDecodeError:&x27;utf-8';读取CSV时的编解码器
我最近从PISA下载了PISA 2012学生数据库。我按照说明在SAS上成功地阅读了它。然后我使用proc export导出为CSV以在Python3中读取它,但在Python pandas:UnicodeDecodeError中尝试读取它时,我一直遇到此错误:“utf-8”编解码器无法解码位置24:无效起始字节中的字节0xc1。我能做什么 pisa2012\u Col=pd.read\u csv('Pisasubset2012Col.csv')尝试使用Python 3.x 错误UnicodeDecodeError:&x27;utf-8';读取CSV时的编解码器,python-3.x,Python 3.x,我最近从PISA下载了PISA 2012学生数据库。我按照说明在SAS上成功地阅读了它。然后我使用proc export导出为CSV以在Python3中读取它,但在Python pandas:UnicodeDecodeError中尝试读取它时,我一直遇到此错误:“utf-8”编解码器无法解码位置24:无效起始字节中的字节0xc1。我能做什么 pisa2012\u Col=pd.read\u csv('Pisasubset2012Col.csv')尝试使用 pisa2012_Col=pd.read
pisa2012_Col=pd.read_csv('Pisasubset2012Col.csv', encoding = "ISO-8859-1")
由于read\u csv
有一个编码选项来处理不同格式的文件(请参阅)尝试使用
pisa2012_Col=pd.read_csv('Pisasubset2012Col.csv', encoding = "ISO-8859-1")
因为
read\u csv
有一个编码选项来处理不同格式的文件(请参阅)谢谢你们。它似乎起作用了。我成功地阅读了它,直到知道为止,变量对我的计算反应良好。似乎解决了。谢谢你们两位。它似乎起作用了。我成功地阅读了它,直到知道为止,变量对我的计算反应良好。似乎已解决。为什么您认为该文件使用ISO-8859-1编码?该文件的数据编码肯定很糟糕。从错误消息中的0xc1开始,我认为拉丁语1
将完成这里的工作ISO-8859-1
或Latin_1
是8位字符集,因此所有垃圾都有一个有效值。为什么您认为该文件是用ISO-8859-1编码的?该文件肯定是编码错误的数据。从错误消息中的0xc1开始,我认为拉丁语1
将完成这里的工作ISO-8859-1
或Latin_1
是8位字符集,因此所有垃圾都有一个有效值。