Python 如何检索pandas中存在错误的所有行

Python 如何检索pandas中存在错误的所有行,python,pandas,Python,Pandas,例如,我可以使用 pd.read_csv('file.csv') 加载csv文件 默认情况下,当出现任何解析错误时,它将失败。我知道可以使用error\u bad\u lines=False跳过有错误的行 但我的问题是: 如何获取发生错误的所有行?这样,我不仅可以潜在地解决这个特定的文件.csv问题,还可以解决批处理中的其他相关文件文件1.csv、文件2.csv、文件3.csv…一个简单的方法是为每一行预先添加行索引号。在加载数据之前,可以使用Awk或Python轻松地完成此操作。您甚至可以在

例如,我可以使用

pd.read_csv('file.csv')
加载csv文件

默认情况下,当出现任何解析错误时,它将失败。我知道可以使用
error\u bad\u lines=False
跳过有错误的行

但我的问题是:


如何获取发生错误的所有行?这样,我不仅可以潜在地解决这个特定的
文件.csv
问题,还可以解决批处理中的其他相关文件
文件1.csv、文件2.csv、文件3.csv…

一个简单的方法是为每一行预先添加行索引号。在加载数据之前,可以使用Awk或Python轻松地完成此操作。您甚至可以在内存中使用StringIO或Python中自定义的类似文件的对象来执行此操作,它会“神奇地”在行号前加上前缀。

warn\u bad\u line在error\u bad\u line设置为False时默认为True。因此,您会收到一条警告,其中提供了发生错误的输入文件中的行号。您还需要什么其他信息?输出如下所示:跳过第4行:预期的5个字段,saw 6跳过第5行:预期的5个字段,saw7@ViennaMike,我希望以一种更为编程的方式获取这些信息。更具体地说,您提到的上述输出帮助我手动检查哪些行有错误。但是,我宁愿将行号存储到变量中。并将所有错误行输出到一个单独的文本文件中,以便下次只需加载有错误的行(例如,加载到数据库中)。