Python pandas read_csv中的编解码器问题_Python_Pandas_Codec

Python pandas read_csv中的编解码器问题

python pandas

Python pandas read_csv中的编解码器问题,python,pandas,codec,Python,Pandas,Codec,我有两个文本文件：十六进制编辑器显示bad.txt开始：“FF FE 53 00 79”，记事本++报告文件为UCS-2 LE BOM。我认为utf_16_le应该对此进行解码，但UnicodeDecodeError的以下代码错误：“utf-16-le”编解码器无法解码位置2：截断数据中的字节0x53： import pandas as pd df1 = pd.read_csv("good.txt") df2 = pd.read_csv("bad.txt", encoding="utf_

我有两个文本文件：

十六进制编辑器显示bad.txt开始：“FF FE 53 00 79”，记事本++报告文件为UCS-2 LE BOM。我认为utf_16_le应该对此进行解码，但UnicodeDecodeError的以下代码错误：“utf-16-le”编解码器无法解码位置2：截断数据中的字节0x53：

import pandas as pd

df1 = pd.read_csv("good.txt")
df2 = pd.read_csv("bad.txt", encoding="utf_16_le")

我已经尝试了我能找到的所有编解码器，但无法让熊猫阅读bad.txt。我有很多这样的文件可以在自动环境中阅读。两个问题：

bad.txt是否有“问题”？生成文件的程序是否以某种方式错误处理了文件

我怎样才能把这读成一个完整的句子？如果需要，我可以用python代码转换文件吗？数据似乎很好，因为许多其他程序（文本编辑器、excel等）都可以解释它，但我如何让熊猫玩得好呢

更新0.20将按预期使用utf-16编解码器处理此文件。感谢您的关注。

适用于我的编码

utf\u 16\u le

或

utf-16

。熊猫0.20.1，Python 3.5.3。你用的是什么版本？废话。熊猫0.18。更新修复了它。非常感谢。如果你愿意，写评论作为答案，我会把它标记为被接受的答案。这很好。过一段时间，你就可以接受自己的答案了。：）这很有哲理……：）谢谢