Python pandas.errors.ParserError:错误可能是因为在使用多字符分隔符时忽略了引号

Python pandas.errors.ParserError:错误可能是因为在使用多字符分隔符时忽略了引号,python,pandas,csv,parsing,Python,Pandas,Csv,Parsing,当我试图使用Pandas读取csv文件时,我遇到了一个解析器错误。下面给出了错误和引发此错误的数据集 pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used. 下面给出的是有此错误的第8行 10/29/18 10:20,85505306, S

当我试图使用Pandas读取csv文件时,我遇到了一个解析器错误。下面给出了错误和引发此错误的数据集

pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used.
下面给出的是有此错误的第8行

10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
我正在使用以下命令读取csv:

df.to_csv('file.csv'), index = False)
csv文件的示例输出:

File_Received_Time  Label1  City    FileName    Label2  Label3  State   Unnamed: 12 cTimestamp  dTimestamp  Label4  Label5  Label6  Label7  Label8
10/29/18 10:20  56776   Paris   file1.csv   29  29  IL      29-10-2018 04:11:11     COL06   620 398 516 451
10/29/18 10:20  46069   Hongkong    file2.csv   61  58  VA      29-10-2018 04:03:17 28-10-2018 05:58:00 COL06   576 645 349 374
10/29/18 10:20  47240   Sydney  file3.csv   43  42  IL      29-10-2018 04:12:46     COL06   534 2047    56831   372
10/29/18 10:20  47432   NewYork file4.csv   55  61  OH          28-10-2018 09:01:00 COL06   514 2354    640 633
10/29/18 10:20  41794   London  file5.csv   39  29          29-10-2018 04:12:46 28-10-2018 09:01:00 COL06   470 2354    56831   550
10/29/18 10:20  49643   LA  file6.csv   55  43  TX      29-10-2018 04:05:18     COL06   523 2301    53942   403
10/29/18 10:20  54700   Shangai file7.csv   37  29  AZ      29-10-2018 04:12:15 28-10-2018 12:51:00 COL06   569 2683    53642   538
10/29/18 10:20  37134   Singapore   file8.csv   53  62  AZ      29-10-2018 04:09:16     COL06   560 391 54541   542
10/29/18 10:20  51144   Taiwan  file9.csv   43  33  TX      29-10-2018 04:12:15     COL06   469 472 458 481

我能够读取您在上面粘贴的错误记录:

要通过pandas读取csv,请使用
read\u csv

mayankp@mayank:~/Documents cat t1.csv 
10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
我将错误记录粘贴到一个
csv

mayankp@mayank:~/Documents cat t1.csv 
10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231
现在,我在《熊猫》中读到如下内容:

In [114]: df = pd.read_csv('/home/mayankp/Documents/t1.csv', header=None)

In [115]: df
Out[115]: 
               0         1          2                        3      4      5     6   7        8        9     10    11   12    13
0  10/29/18 10:20  85505306      Scott  20181029102023-file.csv  22.49 -12.18  CITY NaN  12:15.0  51:00.0  ABCD  9898  320  D231

它很好用。如果有帮助,请告诉我。

我收到了相同的错误消息。我已经从文件中删除了双引号,这就解决了问题。我在终端中使用了以下行:

cat merged.csv | tr“”o“>merged.tsv

希望能有所帮助。

所以

  • 您正在使用
    读取csv
    而不是
    读取csv
    。参见Mayank Porwal评论和回答
  • 您的数据可能格式不正确。CSV表示逗号分隔的值,因此在使用
    read\u CSV
    之前,请使用逗号分隔这些值(不确定您在自己的测试中使用的数据集,您的问题在这一点上具有误导性)
  • 对于核心问题,请仔细检查每行上的字段数。每一行上都应该有相同的号码。这也许可以解释为什么会出现这种错误

Python引擎似乎是问题所在。尝试使用pandas.read\u csv并设置delim\u whitespace=True

您可以共享您的
csv
文件的示例吗?@MayankPorwal已使用文件前几行的示例视图进行了更新csv@Alex,我用csv的几行样本进行了更新file@darkhorse你写道,
我正在使用以下命令读取csv:df.to_csv('file.csv'),index=False)
。此命令不读取,而是写入csv。要阅读
csv
,请使用
read\u csv