Python '；utf-8'；编解码器可以'；将字节0x96解码到位置。。。当熊猫读取文本文件时，请读取\u csv_Python_Text

Python '；utf-8'；编解码器可以'；将字节0x96解码到位置。。。当熊猫读取文本文件时，请读取\u csv

python text

Python '；utf-8'；编解码器可以'；将字节0x96解码到位置。。。当熊猫读取文本文件时，请读取\u csv,python,text,Python,Text,我想使用pandasread\u csv读取文本文件，但出现错误 “utf-8”编解码器无法解码第28位的字节0x96：无效的起始字节我试过从其他帖子中用encoding='latin1'，encoding='iso-8859-1'或encoding='cp1252'阅读csv。但并非所有这些都为我工作。对于encoding='latin1'，我得到了一个错误error标记化数据。C错误：第6行应为1个字段，saw 3 以下是我读取文件的方式： df=pd.read\u csv（“004.tx

我想使用pandas

read\u csv

读取文本文件，但出现错误

“utf-8”编解码器无法解码第28位的字节0x96：无效的起始字节

我试过从其他帖子中用

encoding='latin1'

，

encoding='iso-8859-1'

或

encoding='cp1252'

阅读csv。但并非所有这些都为我工作。对于

encoding='latin1'

，我得到了一个错误

error标记化数据。C错误：第6行应为1个字段，saw 3

以下是我读取文件的方式：

df=pd.read\u csv（“004.txt”，encoding=“utf-8”）
打印（df.head（））

有人能帮我解决这个问题吗？感谢您的光临

tokenizing data. C error: Expected 1 fields in line 6, saw 3

该文件不是正确的CSV格式。你有1-5行没有'，'和在第6行你有2'，'

但是，您可以使用文件读取操作读取文件。遵循以下步骤：
1.在记事本中打开文件。
2.单击另存为选项
3.在保存按钮的左侧，您可以选择编码。
4.选择utf-8作为编码。
5.试试这个代码

这些步骤将解决问题

utf-8' codec can't decode byte 0x96 in position 28: invalid start byte

代码：

f = open('004.txt','r')
data = f.read()
print(data)

看起来它不是一个有效的CSV文件。请您向我们显示CSV中的前7行，好吗？我还尝试了另一种打开文本文件的方法，但也出现了一个错误

f=open（“004.txt”，“r”）print（f.read（））

错误

'cp950'编解码器无法解码第28位的字节0x96：非法多字节序列

这就是我的文件的样子，直接用记事本打开文本文件

儿科肺病学38:161？67（2004）用于打鼾儿童的鼻皮质类固醇1,2 1,2 Emmanuel I.Alexopoulos医学博士，Athanasios G.Kaditis医学博士，*Efthimia Kalampouka医学博士，1 2 21 Eleni Kostadima医学博士，Nikiforos V.Angelopoulos医学博士，Vasiliki Mikraki医学博士，Nikolaos Skenteris医学博士，1和Konstantinos Gourgoulianis，MD3

这是一篇完整的期刊论文，大部分是1-2个字的行…你用熊猫阅读这篇文章的目的是什么？我尝试用记事本打开并保存为“utf-8”，然后尝试了你的代码，但是得到一个错误：UnicodeDecodeError:“cp950”编解码器无法解码5807位置的字节0xee：非法的多字节序列将文件另存为“.txt”。很抱歉，我没有正确描述它。我按照您的指示将其保存为带有“utf-8”的“.txt”，但通过将编码指定为utf-8来获取错误。是的，我上面提到的错误“cp950”编解码器无法解码5807位的字节0xee：当我将文件保存为带有“utf8”编码的“.txt”文件时，返回了非法的多字节序列。