Python 索引到pandas groupby的结果做什么?
假设我有这个数据框Python 索引到pandas groupby的结果做什么?,python,pandas,Python,Pandas,假设我有这个数据框 df = pd.DataFrame([['a', 'b', 'c'], ['1', '2', '3'], ['4', '5', '6']], index=['A', 'B', 'C'], columns=['x', 'y', 'z']) x y z A a b c B 1 2 3 C
df = pd.DataFrame([['a', 'b', 'c'],
['1', '2', '3'],
['4', '5', '6']],
index=['A', 'B', 'C'],
columns=['x', 'y', 'z'])
x y z
A a b c
B 1 2 3
C 4 5 6
我看到了代码,df.groupby('x')['y']
。在这里,['y']
做什么?我理解('x')
。
提前谢谢 新索引是您使用
groupby()
创建的新组。['y']
将返回列y
。但是,您还需要对聚合行调用函数,如sum()
。下面是一个例子:
将熊猫作为pd导入
df=pd.DataFrame({'Name':['Mark','劳拉','Adam','Roger','Anna'],
‘城市’:[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’],
‘高度’:[173.4151.8179.3169.1166.4])
打印(df)
返回按城市分组的人员总数:
df.groupby('City').sum()['Height']
Out[46]:
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称:高度,数据类型:float64
新索引是组,您选择了一列显示。您可以将其放在
sum()
之前或之后 新索引是您使用groupby()
创建的新组。['y']
将返回列y
。但是,您还需要对聚合行调用函数,如sum()
。下面是一个例子:
将熊猫作为pd导入
df=pd.DataFrame({'Name':['Mark','劳拉','Adam','Roger','Anna'],
‘城市’:[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’],
‘高度’:[173.4151.8179.3169.1166.4])
打印(df)
返回按城市分组的人员总数:
df.groupby('City').sum()['Height']
Out[46]:
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称:高度,数据类型:float64
新索引是组,您选择了一列显示。您可以将其放在sum()
之前或之后
创建一组df,将相同的x
值分配给给定行。然后,对于这些组中的每一组,您都将看到y
列,并计算它出现的次数。这类似于value_counts()(此groupby()操作的快捷方式)
创建一组df,将相同的
x
值分配给给定行。然后,对于这些组中的每一组,您都将看到y
列,并计算它出现的次数。它类似于value_counts()(此groupby()操作的快捷方式)。它返回列y
您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.seriesgroubby对象。这里,('x')
用于DataFrameGroupBy,而['y']
用于pandasdf.groupby('x')
col上的组df.groupby('x')['y']
它返回列y
您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.SeriesGroupBy对象。这里,('x')
用于DataFrameGroupBy,而['y']
用于pandasdf.groupby('x')
中的SeriesGroupBy,如果对值进行分组,你需要告诉熊猫你希望它们如何分组。什么意思?总的来说?因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗?听起来你需要一个教程或指南,堆栈溢出并不是这个意思。另外,我认为你分享的代码已经在这么做了。我不是OP,只是一个旁观者。不管怎样,我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中:DataFrameGroupBy
Returns:取决于调用对象,并返回包含组信息的groupby对象。如果对值进行分组,则需要告诉panda如何对其进行分组。什么意思?总的来说?因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗?听起来你需要一个教程或指南,堆栈溢出并不是这个意思。另外,我认为你分享的代码已经在这么做了。我不是OP,只是一个旁观者。不管怎样,我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中:DataFrameGroupBy
Returns:取决于调用对象,并返回包含组信息的groupby对象。
Name City Height
0 Mark Lisbon 173.4
1 Laura Montreal 151.8
2 Adam Lisbon 179.3
3 Roger Berlin 169.1
4 Anna Glasgow 166.4
groupby()