Python 将每组中两列之间的差异相加_Python_Python 3.x_Pandas_Dataframe_Pandas Groupby

Python 将每组中两列之间的差异相加

python python-3.x pandas dataframe

Python 将每组中两列之间的差异相加,python,python-3.x,pandas,dataframe,pandas-groupby,Python,Python 3.x,Pandas,Dataframe,Pandas Groupby,我有一个df看起来像 A B C D 2017-10-01 2017-10-11 M 2017-10 2017-10-02 2017-10-03 M 2017-10 2017-11-01 2017-11-04 B 2017-11 2017-11-08 2017-11-09 B 2017-11 2018-01-01 2018-01-0

我有一个

df

看起来像

A               B              C    D
2017-10-01      2017-10-11     M    2017-10
2017-10-02      2017-10-03     M    2017-10
2017-11-01      2017-11-04     B    2017-11
2017-11-08      2017-11-09     B    2017-11
2018-01-01      2018-01-03     A    2018-01

和

的

dtype

是

datetime64

，

和

是

字符串

我喜欢通过

groupby

和

获得

和

之间的差异

df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A'])

但我不知道如何将各组的差异相加，并将值分配到一个新的列，比如说

，可能是在一个新的

df

中

C    D          E
M    2017-10    11
M    2017-10    11
B    2017-11    4
B    2017-11    4
A    2018-01    2

基于您的代码

df.merge(df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A']).sum(level=[0,1]).reset_index())
Out[292]: 
           A          B  C        D       0
0 2017-10-01 2017-10-11  M  2017-10 11 days
1 2017-10-02 2017-10-03  M  2017-10 11 days
2 2017-11-01 2017-11-04  B  2017-11  4 days
3 2017-11-08 2017-11-09  B  2017-11  4 days
4 2018-01-01 2018-01-03  A  2018-01  2 days

给定示例的预期输出是什么？当您

groupby

对

和

列的差异应用什么函数时，您想知道是否可以对一行代码也应用

Timedelta.days

，这样我就不必

df['E'].apply（λx:x.days）

稍后？@daiyue您可以尝试在这里添加df.groupby（['C'，D']）.apply（lambda行：（行['B']-行['A'].days）

属性错误：“Series”对象没有属性“days”

@daiyue让我们试试

df.groupby（['C'，D']）.apply（lambda行：（行['B']-行['A']）/np timedelta64（1，'D'）。/code>@daiyue（df.B-df.A）.dt.天