Python 2.7 大熊猫一组一组的计算
我有一个数据框,它由两列组成-日期和客户,我将金额相加:Python 2.7 大熊猫一组一组的计算,python-2.7,pandas,Python 2.7,Pandas,我有一个数据框,它由两列组成-日期和客户,我将金额相加: new_df=df.groupby(['Date',Client']) 现在我得到以下df: Sum Date Client 1/1 A 0.8 B 0.2 1/2 A 0.1 B 0.9 我希望能够抓住一个事实,在0.8到0.2的比率变化到0.1到0.9之间有一个很高的波动。最有效的方法是什么?此外,在尝试执行此操作时,我无法访问日期和
new_df=df.groupby(['Date',Client'])
现在我得到以下df:
Sum
Date Client
1/1 A 0.8
B 0.2
1/2 A 0.1
B 0.9
我希望能够抓住一个事实,在0.8到0.2的比率变化到0.1到0.9之间有一个很高的波动。最有效的方法是什么?此外,在尝试执行此操作时,我无法访问日期和客户端字段
new_df[['Date','Client']]
为什么会这样?IIUC您可以使用或:
谢谢,这是第四个方向,但我想知道仅A与仅B的区别…?如果我理解正确,请将groupby的列从
Date
更改为Client
-new_-df['pct_-change']=new_-df.groupby('Client')['Sum'].pct_-change()
new_df = df.groupby(['Date','Client'], as_index=False).sum()
print (new_df)
Date Client Sum
0 1/1 A 0.8
1 1/1 B 0.2
2 1/2 A 0.1
3 1/2 B 0.9
new_df['pct_change'] = new_df.groupby('Date')['Sum'].pct_change()
new_df['diff'] = new_df.groupby('Date')['Sum'].diff()
print (new_df)
Date Client Sum pct_change diff
0 1/1 A 0.8 NaN NaN
1 1/1 B 0.2 -0.75 -0.6
2 1/2 A 0.1 NaN NaN
3 1/2 B 0.9 8.00 0.8