Python 数据帧子集的统计信息 让我们考虑一下熊猫数据报: A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1
我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是:Python 数据帧子集的统计信息 让我们考虑一下熊猫数据报: A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1,python,pandas,Python,Pandas,我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是: new = pd.DataFrame() for id in set(df.A): sub = df[df.A == id) new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},]) 我想知道是否有更有效的方法来做到这一点。像这样吗?它从A计算每个ID分组的平均值和标准偏差 df.groupby('A').ag
new = pd.DataFrame()
for id in set(df.A):
sub = df[df.A == id)
new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},])
我想知道是否有更有效的方法来做到这一点。像这样吗?它从A计算每个ID分组的平均值和标准偏差
df.groupby('A').agg({'B': ['mean', 'std']})
B
mean std
A
1 3.0 NaN
2 3.5 3.535534
4 6.0 NaN
6 5.5 2.121320
7 1.5 0.707107
8 2.5 0.707107
你读过groupby上的吗?