Python 大熊猫的累积总数

Python 大熊猫的累积总数,python,pandas,Python,Pandas,我有一个数据框,看起来像这样: project_code start_date end_date date spend 489 5/15/18 5/15/19 3/1/19 100 489 5/15/18 5/15/19 4/1/19 250 489 5/15/18 5/15/19 5/1/19 50 511

我有一个数据框,看起来像这样:

project_code   start_date   end_date   date       spend
     489        5/15/18     5/15/19     3/1/19     100
     489        5/15/18     5/15/19     4/1/19     250
     489        5/15/18     5/15/19     5/1/19     50
     511        4/1/19      4/1/20      2/1/20     90
     511        4/1/19      4/1/20      3/1/20     50       
     489        5/15/19     5/15/20     3/1/20     100

我需要在同一个表中创建另一列,用于计算该订阅期间(由开始日期和结束日期定义)的累计支出。因此,它应该在项目代码下添加所有以前的支出,只要它们具有相同的开始/结束日期

project_code   start_date   end_date   date       spend    cumulative_subscription_spend
     489        5/15/18     5/15/19     3/1/19     100           100
     489        5/15/18     5/15/19     4/1/19     250           350
     489        5/15/18     5/15/19     5/1/19     50            400
     511        4/1/19      4/1/20      2/1/20     90            90
     511        4/1/19      4/1/20      3/1/20     50            140
     489        6/1/19      6/1/20      3/1/20     100           100


我见过的大多数版本都使用groupby/aggregate,但我很难弄清楚它如何作为同一个表中的新列工作。

请查看
groupby
+
cumsum

df['cumulative_subscription_spend'] = df.groupby('project_code')['spend'].cumsum()

尝试
pandas.DataFrame.cumsum
。这能回答您的问题吗?当我按“项目代码”和“开始日期”进行分组时,这一点起到了作用