Python pandas.errors.ParserError:错误可能是因为在使用多字符分隔符时忽略了引号
当我试图使用Pandas读取csv文件时,我遇到了一个解析器错误。下面给出了错误和引发此错误的数据集Python pandas.errors.ParserError:错误可能是因为在使用多字符分隔符时忽略了引号,python,pandas,csv,parsing,Python,Pandas,Csv,Parsing,当我试图使用Pandas读取csv文件时,我遇到了一个解析器错误。下面给出了错误和引发此错误的数据集 pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used. 下面给出的是有此错误的第8行 10/29/18 10:20,85505306, S
pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used.
下面给出的是有此错误的第8行
10/29/18 10:20,85505306, Scott,20181029102023-file.csv, 22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
我正在使用以下命令读取csv:
df.to_csv('file.csv'), index = False)
csv文件的示例输出:
File_Received_Time Label1 City FileName Label2 Label3 State Unnamed: 12 cTimestamp dTimestamp Label4 Label5 Label6 Label7 Label8
10/29/18 10:20 56776 Paris file1.csv 29 29 IL 29-10-2018 04:11:11 COL06 620 398 516 451
10/29/18 10:20 46069 Hongkong file2.csv 61 58 VA 29-10-2018 04:03:17 28-10-2018 05:58:00 COL06 576 645 349 374
10/29/18 10:20 47240 Sydney file3.csv 43 42 IL 29-10-2018 04:12:46 COL06 534 2047 56831 372
10/29/18 10:20 47432 NewYork file4.csv 55 61 OH 28-10-2018 09:01:00 COL06 514 2354 640 633
10/29/18 10:20 41794 London file5.csv 39 29 29-10-2018 04:12:46 28-10-2018 09:01:00 COL06 470 2354 56831 550
10/29/18 10:20 49643 LA file6.csv 55 43 TX 29-10-2018 04:05:18 COL06 523 2301 53942 403
10/29/18 10:20 54700 Shangai file7.csv 37 29 AZ 29-10-2018 04:12:15 28-10-2018 12:51:00 COL06 569 2683 53642 538
10/29/18 10:20 37134 Singapore file8.csv 53 62 AZ 29-10-2018 04:09:16 COL06 560 391 54541 542
10/29/18 10:20 51144 Taiwan file9.csv 43 33 TX 29-10-2018 04:12:15 COL06 469 472 458 481
我能够读取您在上面粘贴的错误记录: 要通过pandas读取csv,请使用
read\u csv
:
mayankp@mayank:~/Documents cat t1.csv
10/29/18 10:20,85505306, Scott,20181029102023-file.csv, 22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
我将错误记录粘贴到一个csv
:
mayankp@mayank:~/Documents cat t1.csv
10/29/18 10:20,85505306, Scott,20181029102023-file.csv, 22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
现在,我在《熊猫》中读到如下内容:
In [114]: df = pd.read_csv('/home/mayankp/Documents/t1.csv', header=None)
In [115]: df
Out[115]:
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 10/29/18 10:20 85505306 Scott 20181029102023-file.csv 22.49 -12.18 CITY NaN 12:15.0 51:00.0 ABCD 9898 320 D231
它很好用。如果有帮助,请告诉我。我收到了相同的错误消息。我已经从文件中删除了双引号,这就解决了问题。我在终端中使用了以下行: cat merged.csv | tr“”o“>merged.tsv 希望能有所帮助。所以
- 您正在使用
而不是读取csv
。参见Mayank Porwal评论和回答读取csv
- 您的数据可能格式不正确。CSV表示逗号分隔的值,因此在使用
之前,请使用逗号分隔这些值(不确定您在自己的测试中使用的数据集,您的问题在这一点上具有误导性)read\u CSV
- 对于核心问题,请仔细检查每行上的字段数。每一行上都应该有相同的号码。这也许可以解释为什么会出现这种错误
csv
文件的示例吗?@MayankPorwal已使用文件前几行的示例视图进行了更新csv@Alex,我用csv的几行样本进行了更新file@darkhorse你写道,我正在使用以下命令读取csv:df.to_csv('file.csv'),index=False)
。此命令不读取,而是写入csv。要阅读csv
,请使用read\u csv
。