在Python中查找ID的最小值、最大值和平均值
我在Python中有两个数据帧。假设第一个是在Python中查找ID的最小值、最大值和平均值,python,pandas,Python,Pandas,我在Python中有两个数据帧。假设第一个是df1。没有必要对id列进行排序 id B C 0 1 5 1 1 1 5 1 2 1 6 1 3 1 7 1 4 2 5 1 5 2 6 1 6 2 6 1 7 3 7 1 8 3 7 1 9 4 6 1 10 4 7 1 11 4 7 1 然后,第二个数据帧df2有一列,其中包含id id 0 1 1 2 2 3 3 4
df1
。没有必要对id列进行排序
id B C
0 1 5 1
1 1 5 1
2 1 6 1
3 1 7 1
4 2 5 1
5 2 6 1
6 2 6 1
7 3 7 1
8 3 7 1
9 4 6 1
10 4 7 1
11 4 7 1
然后,第二个数据帧df2
有一列,其中包含id
id
0 1
1 2
2 3
3 4
我想为每个id
计算列B
的最小值、最大值和平均值,并将其添加到第二个数据帧中。结果如下:
id min max avg
0 1 5 7 5.75
1 2 ..
2 3 ..
3 4 ..
在这个例子中,我能够通过为每个
id
手册计算它们来复制它。这不是问题,因为示例只有4个ID。但我的真实示例有1000多个ID。有没有什么自动方法可以做到这一点?对组使用agg
功能
In [96]: df.groupby('id')['B'].agg([pd.np.min, pd.np.max, pd.np.mean])
Out[96]:
amin amax mean
id
1 5 7 5.750000
2 5 6 5.666667
3 7 7 7.000000
4 6 7 6.666667
你可以只做
df.groupby('id')['B'].agg(['min','max','mean'])
这里是真的,我给了你一个提示,你可以使用numpy funcs到agg。我想在你尝试哪个UFUNC已经从字符串映射到它们的np等价物之前,很难知道