Python 在mac上打开pandas中的csv文件时出现utf-8错误
我试图在mac上用utf8打开一个带有日语字符的csv文件 我使用的代码如下:Python 在mac上打开pandas中的csv文件时出现utf-8错误,python,pandas,csv,utf-8,Python,Pandas,Csv,Utf 8,我试图在mac上用utf8打开一个带有日语字符的csv文件 我使用的代码如下: foo = pd.read_csv("filename.csv", encoding = 'utf8') 但是,我一直收到以下错误消息 'utf-8' codec can't decode byte 0x96 in position 0 我试过四处看看,但很多解决方案似乎都是针对windows的/我还没有在其他解决方案上取得任何成功 谢谢你的帮助 您的文件似乎真的有一个非unicode字符。此文件的正确编码在很大
foo = pd.read_csv("filename.csv", encoding = 'utf8')
但是,我一直收到以下错误消息
'utf-8' codec can't decode byte 0x96 in position 0
我试过四处看看,但很多解决方案似乎都是针对windows的/我还没有在其他解决方案上取得任何成功
谢谢你的帮助 您的文件似乎真的有一个非unicode字符。此文件的正确编码在很大程度上取决于其内容,但在最常见的情况下,可以使用CP-1252对0x96进行解码。所以,试着像下面这样解码它:
foo = pd.read_csv("filename.csv", encoding = 'cp1252')
如果您不知道文件的原始编码,可以尝试使用第三方LIB(如)检测它
如果你上传一大块文件来重现问题,我可能会帮你多一点。谢谢!不幸的是,我也尝试了“cp1252”,所以我同意,我认为我需要进一步查看该文件,看看是怎么回事,并找到原始编码。谢谢你的帮助@用户_seaveed:最终您可以使用:它有助于确定编码