Python 大熊猫的累积总数
我有一个数据框,看起来像这样:Python 大熊猫的累积总数,python,pandas,Python,Pandas,我有一个数据框,看起来像这样: project_code start_date end_date date spend 489 5/15/18 5/15/19 3/1/19 100 489 5/15/18 5/15/19 4/1/19 250 489 5/15/18 5/15/19 5/1/19 50 511
project_code start_date end_date date spend
489 5/15/18 5/15/19 3/1/19 100
489 5/15/18 5/15/19 4/1/19 250
489 5/15/18 5/15/19 5/1/19 50
511 4/1/19 4/1/20 2/1/20 90
511 4/1/19 4/1/20 3/1/20 50
489 5/15/19 5/15/20 3/1/20 100
我需要在同一个表中创建另一列,用于计算该订阅期间(由开始日期和结束日期定义)的累计支出。因此,它应该在项目代码下添加所有以前的支出,只要它们具有相同的开始/结束日期
project_code start_date end_date date spend cumulative_subscription_spend
489 5/15/18 5/15/19 3/1/19 100 100
489 5/15/18 5/15/19 4/1/19 250 350
489 5/15/18 5/15/19 5/1/19 50 400
511 4/1/19 4/1/20 2/1/20 90 90
511 4/1/19 4/1/20 3/1/20 50 140
489 6/1/19 6/1/20 3/1/20 100 100
我见过的大多数版本都使用groupby/aggregate,但我很难弄清楚它如何作为同一个表中的新列工作。请查看
groupby
+cumsum
df['cumulative_subscription_spend'] = df.groupby('project_code')['spend'].cumsum()
尝试
pandas.DataFrame.cumsum
。这能回答您的问题吗?当我按“项目代码”和“开始日期”进行分组时,这一点起到了作用