Python 用Groupby中的重复日期填充DataFrame中缺失的日期
我试图从以下数据框中获取每日状态计数(这是一个子集,实际数据集是~14k个日期重叠的作业,作业中任何给定时间只有一个状态): 我最初的想法(从下面的链接)是按“工作”列分组,填写每个组缺少的日期,然后填写状态 我能够做到这一点…有点…如果两个状态发生在同一天,一个将不包括在输出中,因此一些状态丢失 然后我发现,它应该可以处理重复的问题,但我无法让它处理我的数据Python 用Groupby中的重复日期填充DataFrame中缺失的日期,python,pandas,Python,Pandas,我试图从以下数据框中获取每日状态计数(这是一个子集,实际数据集是~14k个日期重叠的作业,作业中任何给定时间只有一个状态): 我最初的想法(从下面的链接)是按“工作”列分组,填写每个组缺少的日期,然后填写状态 我能够做到这一点…有点…如果两个状态发生在同一天,一个将不包括在输出中,因此一些状态丢失 然后我发现,它应该可以处理重复的问题,但我无法让它处理我的数据 我是否认为填写缺失的日期,然后填写状态是最终获取个人状态每日计数的正确方法?有没有其他方法可以更好地使用我所缺少的pandas功能?
我是否认为填写缺失的日期,然后填写状态是最终获取个人状态每日计数的正确方法?有没有其他方法可以更好地使用我所缺少的pandas功能?这听起来不错。诀窍无疑是将每天的开和关相加(其中开/关分别用于A、B、C等)。
Job Status User
Date / Time
1/24/2011 10:58:04 1 A Ted
1/24/2011 10:59:20 1 C Bill
2/11/2011 6:53:14 1 A Ted
2/11/2011 6:53:23 1 B Max
2/15/2011 9:43:13 1 C Bill
2/21/2011 15:24:42 1 F Jim
3/2/2011 15:55:22 1 G Phil Jr.
3/4/2011 14:57:45 1 H Ted
3/7/2011 14:11:02 1 I Jim
3/9/2011 9:57:34 1 J Tim
8/18/2014 11:59:35 2 A Ted
8/18/2014 13:56:21 2 F Bill
5/21/2015 9:30:30 2 G Jim
6/5/2015 13:17:54 2 H Jim
6/5/2015 14:40:38 2 I Ted
6/9/2015 10:39:15 2 J Tom
1/16/2015 7:45:58 3 A Phil Jr.
1/16/2015 7:48:23 3 C Jim
3/6/2015 14:09:42 3 A Bill
3/11/2015 11:16:04 3 K Jim