Python 索引到pandas groupby的结果做什么?

Python 索引到pandas groupby的结果做什么?,python,pandas,Python,Pandas,假设我有这个数据框 df = pd.DataFrame([['a', 'b', 'c'], ['1', '2', '3'], ['4', '5', '6']], index=['A', 'B', 'C'], columns=['x', 'y', 'z']) x y z A a b c B 1 2 3 C

假设我有这个数据框

df = pd.DataFrame([['a', 'b', 'c'], 
                   ['1', '2', '3'], 
                   ['4', '5', '6']],
                  index=['A', 'B', 'C'], 
                  columns=['x', 'y', 'z'])

    x   y   z
A   a   b   c
B   1   2   3
C   4   5   6
我看到了代码,
df.groupby('x')['y']
。在这里,
['y']
做什么?我理解
('x')


提前谢谢

新索引是您使用
groupby()
创建的新组。
['y']
将返回列
y
。但是,您还需要对聚合行调用函数,如
sum()
。下面是一个例子:

将熊猫作为pd导入
df=pd.DataFrame({'Name':['Mark','劳拉','Adam','Roger','Anna'],
‘城市’:[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’],
‘高度’:[173.4151.8179.3169.1166.4])
打印(df)
返回按城市分组的人员总数:

df.groupby('City').sum()['Height']
Out[46]:
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称:高度,数据类型:float64

新索引是组,您选择了一列显示。您可以将其放在
sum()
之前或之后

新索引是您使用
groupby()
创建的新组。
['y']
将返回列
y
。但是,您还需要对聚合行调用函数,如
sum()
。下面是一个例子:

将熊猫作为pd导入
df=pd.DataFrame({'Name':['Mark','劳拉','Adam','Roger','Anna'],
‘城市’:[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’],
‘高度’:[173.4151.8179.3169.1166.4])
打印(df)
返回按城市分组的人员总数:

df.groupby('City').sum()['Height']
Out[46]:
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称:高度,数据类型:float64
新索引是组,您选择了一列显示。您可以将其放在
sum()
之前或之后

创建一组df,将相同的
x
值分配给给定行。然后,对于这些组中的每一组,您都将看到
y
列,并计算它出现的次数。这类似于value_counts()(此groupby()操作的快捷方式)


创建一组df,将相同的
x
值分配给给定行。然后,对于这些组中的每一组,您都将看到
y
列,并计算它出现的次数。它类似于value_counts()(此groupby()操作的快捷方式)。

它返回列
y
您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.seriesgroubby对象。这里,
('x')
用于DataFrameGroupBy,而
['y']
用于pandas
df.groupby('x')
col上的组
df.groupby('x')['y']
它返回列
y
您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.SeriesGroupBy对象。这里,
('x')
用于DataFrameGroupBy,而
['y']
用于pandas
df.groupby('x')
中的SeriesGroupBy,如果对值进行分组,你需要告诉熊猫你希望它们如何分组。什么意思?总的来说?因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗?听起来你需要一个教程或指南,堆栈溢出并不是这个意思。另外,我认为你分享的代码已经在这么做了。我不是OP,只是一个旁观者。不管怎样,我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中:
DataFrameGroupBy
Returns:取决于调用对象,并返回包含组信息的groupby对象。如果对值进行分组,则需要告诉panda如何对其进行分组。什么意思?总的来说?因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗?听起来你需要一个教程或指南,堆栈溢出并不是这个意思。另外,我认为你分享的代码已经在这么做了。我不是OP,只是一个旁观者。不管怎样,我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中:
DataFrameGroupBy
Returns:取决于调用对象,并返回包含组信息的groupby对象。
    Name      City  Height
0   Mark    Lisbon   173.4
1  Laura  Montreal   151.8
2   Adam    Lisbon   179.3
3  Roger    Berlin   169.1
4   Anna   Glasgow   166.4
groupby()