Python 将`[data2]`和`[[data2]]`与`groupby`一起使用有什么区别`
我正在学习Python for data analysis教程,希望对使用Python 将`[data2]`和`[[data2]]`与`groupby`一起使用有什么区别`,python,pandas,dataframe,group-by,Python,Pandas,Dataframe,Group By,我正在学习Python for data analysis教程,希望对使用[data2]和[[data2]]]时使用groupby得到的输出进行一些说明 如果使用: [data2] 使用多索引可以获得系列 如果使用子集 [[data2]] 使用多索引可以获得数据帧 如果使用: df.groupby(['key1','key2'], as_index=False)['data2'].mean() 您将获得DataFrame,其中包含3个列,而不包含multi-index 如果使用另一种形式,
[data2]
和[[data2]]]
时使用groupby
得到的输出进行一些说明
如果使用:
[data2]
使用多索引
可以获得系列
如果使用子集
[[data2]]
使用多索引
可以获得数据帧
如果使用:
df.groupby(['key1','key2'], as_index=False)['data2'].mean()
您将获得DataFrame
,其中包含3个列,而不包含multi-index
如果使用另一种形式,可能会更清楚:
import pandas as pd
df = pd.DataFrame({'key1':[1,2,2,1,2,2],
'key2':[4,4,4,4,5,5],
'data2':[7,8,9,1,3,5],
'D':[1,3,5,7,9,5]})
print (df)
D data2 key1 key2
0 1 7 1 4
1 3 8 2 4
2 5 9 2 4
3 7 1 1 4
4 9 3 2 5
5 5 5 2 5
print (df['data2'].groupby([df.key1,df.key2]).mean())
key1 key2
1 4 4.0
2 4 8.5
5 4.0
Name: data2, dtype: float64
print (df[['data2']].groupby([df.key1,df.key2]).mean())
data2
key1 key2
1 4 4.0
2 4 8.5
5 4.0