Python ';utf-8';编解码器可以';将字节0x96解码到位置。。。当熊猫读取文本文件时,请读取\u csv

Python ';utf-8';编解码器可以';将字节0x96解码到位置。。。当熊猫读取文本文件时,请读取\u csv,python,text,Python,Text,我想使用pandasread\u csv读取文本文件,但出现错误 “utf-8”编解码器无法解码第28位的字节0x96:无效的起始字节 我试过从其他帖子中用encoding='latin1',encoding='iso-8859-1'或encoding='cp1252'阅读csv。但并非所有这些都为我工作。对于encoding='latin1',我得到了一个错误error标记化数据。C错误:第6行应为1个字段,saw 3 以下是我读取文件的方式: df=pd.read\u csv(“004.tx

我想使用pandas
read\u csv
读取文本文件,但出现错误
“utf-8”编解码器无法解码第28位的字节0x96:无效的起始字节

我试过从其他帖子中用
encoding='latin1'
encoding='iso-8859-1'
encoding='cp1252'
阅读csv。但并非所有这些都为我工作。对于
encoding='latin1'
,我得到了一个错误
error标记化数据。C错误:第6行应为1个字段,saw 3

以下是我读取文件的方式:

df=pd.read\u csv(“004.txt”,encoding=“utf-8”)
打印(df.head())
有人能帮我解决这个问题吗?感谢您的光临

tokenizing data. C error: Expected 1 fields in line 6, saw 3
该文件不是正确的CSV格式。你有1-5行没有','和在第6行你有2','

但是,您可以使用文件读取操作读取文件。 遵循以下步骤:
1.在记事本中打开文件。
2.单击另存为选项
3.在保存按钮的左侧,您可以选择编码。
4.选择utf-8作为编码。
5.试试这个代码

这些步骤将解决问题

utf-8' codec can't decode byte 0x96 in position 28: invalid start byte
代码:

f = open('004.txt','r')
data = f.read()
print(data)

看起来它不是一个有效的CSV文件。请您向我们显示CSV中的前7行,好吗?我还尝试了另一种打开文本文件的方法,但也出现了一个错误
f=open(“004.txt”,“r”)print(f.read())
错误
'cp950'编解码器无法解码第28位的字节0x96:非法多字节序列
这就是我的文件的样子,直接用记事本打开文本文件
儿科肺病学38:161?67(2004)用于打鼾儿童的鼻皮质类固醇1,2 1,2 Emmanuel I.Alexopoulos医学博士,Athanasios G.Kaditis医学博士,*Efthimia Kalampouka医学博士,1 2 21 Eleni Kostadima医学博士,Nikiforos V.Angelopoulos医学博士,Vasiliki Mikraki医学博士,Nikolaos Skenteris医学博士,1和Konstantinos Gourgoulianis,MD3
这是一篇完整的期刊论文,大部分是1-2个字的行…你用熊猫阅读这篇文章的目的是什么?我尝试用记事本打开并保存为“utf-8”,然后尝试了你的代码,但是得到一个错误:UnicodeDecodeError:“cp950”编解码器无法解码5807位置的字节0xee:非法的多字节序列将文件另存为“.txt”。很抱歉,我没有正确描述它。我按照您的指示将其保存为带有“utf-8”的“.txt”,但通过将编码指定为utf-8来获取错误。是的,我上面提到的错误“cp950”编解码器无法解码5807位的字节0xee:当我将文件保存为带有“utf8”编码的“.txt”文件时,返回了非法的多字节序列。