Python 按Groupby中的日期聚合数据帧计数
我有一个带有第一个和最后一个日期列的Pandas数据框,从中我构建了一个Python 按Groupby中的日期聚合数据帧计数,python,pandas,group-by,count,date-range,Python,Pandas,Group By,Count,Date Range,我有一个带有第一个和最后一个日期列的Pandas数据框,从中我构建了一个dr字段,其中包含范围内的日期列表: _id FID first_seen last_seen dr 607abc 1925 2020-11-13 2021-04-22 DatetimeIndex(['2020-11-13', '2020-11-14', '20...]) 608abd 1925 2021-03-05 2021-03-07 Datetime
dr
字段,其中包含范围内的日期列表:
_id FID first_seen last_seen dr
607abc 1925 2020-11-13 2021-04-22 DatetimeIndex(['2020-11-13', '2020-11-14', '20...])
608abd 1925 2021-03-05 2021-03-07 DatetimeIndex(['2021-03-05', '2021-03-06', '20...])
442xae 1331 2020-05-05 2021-04-22 DatetimeIndex(['2020-05-05', '2021-04022', '20...])
...
对于每个FID
,对于与该FID相关的每个日期,我需要获取该日期的\u id
计数。例如,从上面可以看出,如下所示:
FID date count(_id)
1925 2020-11-13 44
1925 2020-11-14 46
...
1925 2021-04-22 61
1331 2020-05-05 189
1331 2020-05-06 190
...
我知道我需要先按FID分组,然后得到第一次看到的最小值和最后一次看到的最大值,然后我就卡住了…让我们试试
分解
df.explode('dr').groupby(['FID','dr']).size()
或者我们可以在这里尝试value\u counts
df.explode('dr').value_counts(['FID','dr'])
Welp brain fart,谢谢你帮我解决了这个问题!