避免在读取csv中读取多索引

避免在读取csv中读取多索引,csv,delimiter,multi-index,Csv,Delimiter,Multi Index,我正在尝试读取一个csv,它在特定行中似乎有问题 我正试图探索这个问题,因为我发现了错误 Error tokenizing data. C error: Expected 23 fields in line 27, saw 37 以下是我的发现: 前26行的读数为OK: zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", nrows=25) 但在第26行,即使数据库没有mu

我正在尝试读取一个csv,它在特定行中似乎有问题

我正试图探索这个问题,因为我发现了错误

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37
以下是我的发现:

前26行的读数为OK:

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", nrows=25)
但在第26行,即使数据库没有multindex,函数也采用multindex数据帧

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", skiprows=25)
即使强制索引为None(index_col=None),结果也是一个多索引表(该表显示了前9列索引)

如何避免这种情况并正确阅读csv

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37
该行的某些字段中很可能有分隔符

确保这些字段被引用并且
quotechar='”


要处理字段中包含的引号,如:

"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";
escapechar='\\'
可以使用

该行的某些字段中很可能有分隔符

确保这些字段被引用并且
quotechar='”


要处理字段中包含的引号,如:

"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";

escapechar='\\'
可以使用。

实际上,quotechar参数并不能解决问题:我意识到数据库中的一个字段包含以下两个引号(“”),打开文本文件中的csv时,它看起来像这样:“L.E.p.DI PIROZZI CARMINE S.a.S.\;“08020650019”)这使得csv_读取器无法检测分隔符!我想知道如何解决这个问题……。@f.g.fornari在这个例子中,字段中的引号用“\”转义(Linux风格)。有时这些引号会用另一个引号转义(该引号会给出S.A.S.“”)。这可能可以通过使用escapechar='\\\'来解决。实际上,quotechar参数并不能解决问题:我意识到该数据库中的字段包含两个引号('',在文本文件中打开csv,看起来是这样的:“L.E.P.DI PIROZZI CARMINE S.a.S.\”;;;“08020650019”;)这使得csv_阅读器无法检测分隔符!我想知道如何解决这个问题。…@f.g.fornari在本例中,字段内的引号用“\”转义(Linux样式)。有时这些引号会用另一个引号转义(该引号会给出S.A.S.“”)。这可能可以通过使用escapechar='\\\'来解决。