Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 将`[data2]`和`[[data2]]`与`groupby`一起使用有什么区别`_Python_Pandas_Dataframe_Group By - Fatal编程技术网

Python 将`[data2]`和`[[data2]]`与`groupby`一起使用有什么区别`

Python 将`[data2]`和`[[data2]]`与`groupby`一起使用有什么区别`,python,pandas,dataframe,group-by,Python,Pandas,Dataframe,Group By,我正在学习Python for data analysis教程,希望对使用[data2]和[[data2]]]时使用groupby得到的输出进行一些说明 如果使用: [data2] 使用多索引可以获得系列 如果使用子集 [[data2]] 使用多索引可以获得数据帧 如果使用: df.groupby(['key1','key2'], as_index=False)['data2'].mean() 您将获得DataFrame,其中包含3个列,而不包含multi-index 如果使用另一种形式,

我正在学习Python for data analysis教程,希望对使用
[data2]
[[data2]]]
时使用
groupby
得到的输出进行一些说明

如果使用:

[data2]
使用
多索引
可以获得
系列

如果使用子集

[[data2]]
使用
多索引
可以获得
数据帧

如果使用:

df.groupby(['key1','key2'], as_index=False)['data2'].mean()
您将获得
DataFrame
,其中包含
3个
列,而不包含
multi-index

如果使用另一种形式,可能会更清楚:

import pandas as pd
df = pd.DataFrame({'key1':[1,2,2,1,2,2],
                   'key2':[4,4,4,4,5,5],
                   'data2':[7,8,9,1,3,5],
                   'D':[1,3,5,7,9,5]})

print (df)
   D  data2  key1  key2
0  1      7     1     4
1  3      8     2     4
2  5      9     2     4
3  7      1     1     4
4  9      3     2     5
5  5      5     2     5


print (df['data2'].groupby([df.key1,df.key2]).mean())
key1  key2
1     4       4.0
2     4       8.5
      5       4.0
Name: data2, dtype: float64

print (df[['data2']].groupby([df.key1,df.key2]).mean())
           data2
key1 key2       
1    4       4.0
2    4       8.5
     5       4.0