如何使用pandas从python中的数据集中查找并更正格式不正确的日期

如何使用pandas从python中的数据集中查找并更正格式不正确的日期,python,pandas,Python,Pandas,我的csv数据集的日期列为datatype=object。我必须把它改成最新的时间。为此,我使用以下代码 列车=pd。读取\u csvrC:\train.csv 列车['Date']=pd.to_datetimetrain.Date,格式='%Y-%d-%m' 这给了我如下的错误 ValueError:未转换的数据仍然存在:2 看起来这些数据中有2个可能不符合实际顺序,例如,可能是2020-02-14,也可能是as 2020-14-02左右。 我有17000行,手动捕获2个数据是不可能的 问题是

我的csv数据集的日期列为datatype=object。我必须把它改成最新的时间。为此,我使用以下代码

列车=pd。读取\u csvrC:\train.csv

列车['Date']=pd.to_datetimetrain.Date,格式='%Y-%d-%m'

这给了我如下的错误

ValueError:未转换的数据仍然存在:2

看起来这些数据中有2个可能不符合实际顺序,例如,可能是2020-02-14,也可能是as 2020-14-02左右。 我有17000行,手动捕获2个数据是不可能的


问题是我如何纠正它?如何找到产生问题的数据。

您可以通过以下方式检查这些行:错误为“强制”,以查找没有匹配VAL的缺失值,通过以下方式进行测试和筛选:


您可以通过以下方式检查这些行:使用errors='concurve'查找不匹配VAL的缺失值,通过以下方式进行测试和筛选:


谢谢,进行测试,但是在isna之后,记录太大,无法计算。需要做大量的过滤。问题是有记录,但不确定为什么不转换。原因是我们需要做的。但是谢谢你的快速回复。@Udaymishra-你认为有很多专栏吗?或者有很多错误的日期时间?我不理解这个问题,但我有一列日期,其中的值错误表示2个数据未转换。@Udaymishra-我只会在记录太大而无法计算时做出反应。所以,请询问是否解决了它。谢谢,正在进行测试,但是在isna之后,记录太大,无法计算。需要做大量的过滤。问题是有记录,但不确定为什么不转换。原因是我们需要做的。但是谢谢你的快速回复。@Udaymishra-你认为有很多专栏吗?或者有很多错误的日期时间?我不理解这个问题,但我有一列日期,其中的值错误表示2个数据未转换。@Udaymishra-我只会在记录太大而无法计算时做出反应。所以,问问是否能解决它。
df = train[pd.to_datetime(train.Date,format='%Y-%d-%m', errors='coerce').isna()]
print (df)