Python pd.to_datetime-用什么填充缺少的值
我有一个包含70列和200000条记录的数据框。有6个dmy格式的日期字段,我想更改为pd.datetime格式。 日期列为Python pd.to_datetime-用什么填充缺少的值,python,pandas,Python,Pandas,我有一个包含70列和200000条记录的数据框。有6个dmy格式的日期字段,我想更改为pd.datetime格式。 日期列为 [“接受日期”、“终止日期”、“结束日期”、“开始日期”、“开始日期”、“国防部”] 我使用以下代码将它们更改为datetime for col in [["ADMIDATE", "DISDATE", "EPIEND", "EPISTART", "OPDATE_01", "DOD"]]: df1[col] = pd.to_datetime(df1[col], fo
[“接受日期”、“终止日期”、“结束日期”、“开始日期”、“开始日期”、“国防部”]
我使用以下代码将它们更改为datetime
for col in [["ADMIDATE", "DISDATE", "EPIEND", "EPISTART", "OPDATE_01", "DOD"]]:
df1[col] = pd.to_datetime(df1[col], format='%d/%m/%Y')
我犯了一个错误
ValueError: to assemble mappings requires at least that [year, month, day] be specified: [day,month,year] is missing
正在查找我发现缺少%的空值的数量
DISDATE-4.0%,
OPDATE_01-14.0%,
国防部-82.0%
其他日期列没有缺少的值。
我想知道如何使用.fillna(0),但这不能满足pd.to_datetime的要求。
如何强制转换包含日期项的字段?我无法删除它们。这篇文章有帮助吗?它解释了如何处理缺少的值。如果合适,您可以尝试使用缺失值两侧的值来插值这些缺失值。尝试
errors='improve'
时没有任何乐趣。我真的无法插值,因为包含条目的字段将有助于计算,而不必保留为空的字段。请尝试df1[col]=pd.to_datetime(df1[col],dayfirst=True)如果指定格式,则必须确保所有条目都满足此格式。dayfirst=True是一个不太严格的参数。不幸的是,同样的错误。可能需要重新考虑我的设计。