Python 用Groupby中的重复日期填充DataFrame中缺失的日期

Python 用Groupby中的重复日期填充DataFrame中缺失的日期,python,pandas,Python,Pandas,我试图从以下数据框中获取每日状态计数(这是一个子集,实际数据集是~14k个日期重叠的作业,作业中任何给定时间只有一个状态): 我最初的想法(从下面的链接)是按“工作”列分组,填写每个组缺少的日期,然后填写状态 我能够做到这一点…有点…如果两个状态发生在同一天,一个将不包括在输出中,因此一些状态丢失 然后我发现,它应该可以处理重复的问题,但我无法让它处理我的数据 我是否认为填写缺失的日期,然后填写状态是最终获取个人状态每日计数的正确方法?有没有其他方法可以更好地使用我所缺少的pandas功能?

我试图从以下数据框中获取每日状态计数(这是一个子集,实际数据集是~14k个日期重叠的作业,作业中任何给定时间只有一个状态):

我最初的想法(从下面的链接)是按“工作”列分组,填写每个组缺少的日期,然后填写状态

我能够做到这一点…有点…如果两个状态发生在同一天,一个将不包括在输出中,因此一些状态丢失

然后我发现,它应该可以处理重复的问题,但我无法让它处理我的数据


我是否认为填写缺失的日期,然后填写状态是最终获取个人状态每日计数的正确方法?有没有其他方法可以更好地使用我所缺少的pandas功能?

这听起来不错。诀窍无疑是将每天的开和关相加(其中开/关分别用于A、B、C等)。
                       Job    Status  User
Date / Time     
1/24/2011 10:58:04      1       A      Ted
1/24/2011 10:59:20      1       C      Bill
2/11/2011 6:53:14       1       A      Ted
2/11/2011 6:53:23       1       B      Max
2/15/2011 9:43:13       1       C      Bill
2/21/2011 15:24:42      1       F      Jim
3/2/2011 15:55:22       1       G      Phil Jr.
3/4/2011 14:57:45       1       H      Ted
3/7/2011 14:11:02       1       I      Jim
3/9/2011 9:57:34        1       J      Tim 
8/18/2014 11:59:35      2       A      Ted
8/18/2014 13:56:21      2       F      Bill
5/21/2015 9:30:30       2       G      Jim
6/5/2015 13:17:54       2       H      Jim
6/5/2015 14:40:38       2       I      Ted
6/9/2015 10:39:15       2       J      Tom
1/16/2015 7:45:58       3       A      Phil Jr.
1/16/2015 7:48:23       3       C      Jim
3/6/2015 14:09:42       3       A      Bill
3/11/2015 11:16:04      3       K      Jim