Python 数据帧子集的统计信息让我们考虑一下熊猫数据报： A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1_Python_Pandas

Python 数据帧子集的统计信息让我们考虑一下熊猫数据报： A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1

python pandas

Python 数据帧子集的统计信息让我们考虑一下熊猫数据报： A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1,python,pandas,Python,Pandas,我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是： new = pd.DataFrame() for id in set(df.A): sub = df[df.A == id) new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},]) 我想知道是否有更有效的方法来做到这一点。像这样吗？它从A计算每个ID分组的平均值和标准偏差 df.groupby('A').ag

我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是：

new = pd.DataFrame()
for id in set(df.A):
    sub = df[df.A == id)
    new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},])

我想知道是否有更有效的方法来做到这一点。

像这样吗？它从A计算每个ID分组的平均值和标准偏差

df.groupby('A').agg({'B': ['mean', 'std']})
      B          
   mean       std
A                
1   3.0       NaN
2   3.5  3.535534
4   6.0       NaN
6   5.5  2.121320
7   1.5  0.707107
8   2.5  0.707107

你读过groupby上的吗？