Pandas 使用列指定的填充类型填写月份
我有一个数据帧,它跟踪特定事件(索赔)的特征,并计算一些“运行总数” 每个月的每次事件(索赔)都有一个记录,直到索赔离开数据中心为止,此时没有记录 我想做的是,在指定日期(特别是2019-12-31)之前插入每个“缺失”的月份 对于某些列,我想用NA填充,但对于其他列,我想返回最后观察到的值。我想我需要通过某种形式的列表来传递这些信息;将有多个值,我希望为其携带“最后观察到的”和多个我希望提供“NaN”的值 简单示例DF:Pandas 使用列指定的填充类型填写月份,pandas,dataframe,Pandas,Dataframe,我有一个数据帧,它跟踪特定事件(索赔)的特征,并计算一些“运行总数” 每个月的每次事件(索赔)都有一个记录,直到索赔离开数据中心为止,此时没有记录 我想做的是,在指定日期(特别是2019-12-31)之前插入每个“缺失”的月份 对于某些列,我想用NA填充,但对于其他列,我想返回最后观察到的值。我想我需要通过某种形式的列表来传递这些信息;将有多个值,我希望为其携带“最后观察到的”和多个我希望提供“NaN”的值 简单示例DF: occ | month | charA | charB | v
occ | month | charA | charB | valC | valD
----------------------------------------------
1 | 2019-08-31 | red | male | 100 | 100
1 | 2019-09-30 | red | male | 100 | 200
1 | 2019-10-31 | red | male | 500 | 700
2 | 2019-10-31 | blue | fem | 800 | 800
2 | 2019-11-31 | blue | fem | 100 | 900
期望输出DF:
occ | month | charA | charB | valC | valD
----------------------------------------------
1 | 2019-08-31 | red | male | 100 | 100
1 | 2019-09-30 | red | male | 100 | 200
1 | 2019-10-31 | red | male | 500 | 700
1 | 2019-11-30 | red | male | NaN | 700
1 | 2019-12-31 | red | male | NaN | 700
2 | 2019-10-31 | blue | fem | 800 | 800
2 | 2019-11-31 | blue | fem | 100 | 900
2 | 2019-12-31 | blue | fem | NaN | 900