Python 索引到pandas groupby的结果做什么？_Python_Pandas

Python 索引到pandas groupby的结果做什么？

python pandas

Python 索引到pandas groupby的结果做什么？,python,pandas,Python,Pandas,假设我有这个数据框 df = pd.DataFrame([['a', 'b', 'c'], ['1', '2', '3'], ['4', '5', '6']], index=['A', 'B', 'C'], columns=['x', 'y', 'z']) x y z A a b c B 1 2 3 C

假设我有这个数据框

df = pd.DataFrame([['a', 'b', 'c'], 
                   ['1', '2', '3'], 
                   ['4', '5', '6']],
                  index=['A', 'B', 'C'], 
                  columns=['x', 'y', 'z'])

    x   y   z
A   a   b   c
B   1   2   3
C   4   5   6

我看到了代码，

df.groupby（'x'）['y']

。在这里，

['y']

做什么？我理解

（'x'）

。

提前谢谢

新索引是您使用

groupby（）

创建的新组。

['y']

将返回列

。但是，您还需要对聚合行调用函数，如

sum（）

。下面是一个例子：

将熊猫作为pd导入
df=pd.DataFrame（{'Name'：['Mark'，'劳拉'，'Adam'，'Roger'，'Anna']，
‘城市’：[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’]，
‘高度’：[173.4151.8179.3169.1166.4]）
打印（df）

返回按城市分组的人员总数：

df.groupby（'City'）.sum（）['Height']

Out[46]：
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称：高度，数据类型：float64

新索引是组，您选择了一列显示。您可以将其放在

sum（）

之前或之后

新索引是您使用

groupby（）

创建的新组。

['y']

将返回列

。但是，您还需要对聚合行调用函数，如

sum（）

。下面是一个例子：

将熊猫作为pd导入
df=pd.DataFrame（{'Name'：['Mark'，'劳拉'，'Adam'，'Roger'，'Anna']，
‘城市’：[‘里斯本’、‘蒙特利尔’、‘里斯本’、‘柏林’、‘格拉斯哥’]，
‘高度’：[173.4151.8179.3169.1166.4]）
打印（df）

返回按城市分组的人员总数：

df.groupby（'City'）.sum（）['Height']

Out[46]：
城市
柏林169.1
格拉斯哥166.4
里斯本352.7
蒙特利尔151.8
名称：高度，数据类型：float64

新索引是组，您选择了一列显示。您可以将其放在

sum（）

之前或之后

创建一组df，将相同的

值分配给给定行。然后，对于这些组中的每一组，您都将看到

列，并计算它出现的次数。这类似于value_counts（）（此groupby（）操作的快捷方式）

创建一组df，将相同的

值分配给给定行。然后，对于这些组中的每一组，您都将看到

列，并计算它出现的次数。它类似于value_counts（）（此groupby（）操作的快捷方式）。

它返回列

您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.seriesgroubby对象。这里，

（'x'）

用于DataFrameGroupBy，而

['y']

用于pandas

df.groupby（'x'）

col上的组

df.groupby（'x'）['y']

它返回列

您是否也要查看。Merci@NicolasGervais它返回pandas.core.groupby.generic.SeriesGroupBy对象。这里，

（'x'）

用于DataFrameGroupBy，而

['y']

用于pandas

df.groupby（'x'）

中的SeriesGroupBy，如果对值进行分组，你需要告诉熊猫你希望它们如何分组。什么意思？总的来说？因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗？听起来你需要一个教程或指南，堆栈溢出并不是这个意思。另外，我认为你分享的代码已经在这么做了。我不是OP，只是一个旁观者。不管怎样，我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中：

DataFrameGroupBy

Returns:取决于调用对象，并返回包含组信息的groupby对象。如果对值进行分组，则需要告诉panda如何对其进行分组。什么意思？总的来说？因为这就是我想要的is@MadPhysicist你看过熊猫的文件了吗？听起来你需要一个教程或指南，堆栈溢出并不是这个意思。另外，我认为你分享的代码已经在这么做了。我不是OP，只是一个旁观者。不管怎样，我都会接受你的建议。我已经看过文件了。我看不到任何迹象表明分组后必须进行聚合。从文档中：

DataFrameGroupBy

Returns：取决于调用对象，并返回包含组信息的groupby对象。

    Name      City  Height
0   Mark    Lisbon   173.4
1  Laura  Montreal   151.8
2   Adam    Lisbon   179.3
3  Roger    Berlin   169.1
4   Anna   Glasgow   166.4

groupby()