Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/276.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 数据帧子集的统计信息 让我们考虑一下熊猫数据报: A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1_Python_Pandas - Fatal编程技术网

Python 数据帧子集的统计信息 让我们考虑一下熊猫数据报: A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1

Python 数据帧子集的统计信息 让我们考虑一下熊猫数据报: A B C D 2012-08-16 2 1 1 7 2012-08-17 6 4 8 6 2012-08-18 8 3 1 1 2012-08-19 7 2 8 9 2012-08-20 6 7 5 8 2012-08-21 1 3 3 3 2012-08-22 8 2 3 8 2012-08-23 7 1 7 4 2012-08-24 2 6 0 6 2012-08-25 4 6 8 1,python,pandas,Python,Pandas,我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是: new = pd.DataFrame() for id in set(df.A): sub = df[df.A == id) new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},]) 我想知道是否有更有效的方法来做到这一点。像这样吗?它从A计算每个ID分组的平均值和标准偏差 df.groupby('A').ag

我想通过对A列中包含的值进行子集来进行统计。实现这一点的最简单示例是:

new = pd.DataFrame()
for id in set(df.A):
    sub = df[df.A == id)
    new = new.append([{'B_mean': sub.B.mean(), 'B_std': sub.B.std(), 'id': id},])

我想知道是否有更有效的方法来做到这一点。

像这样吗?它从A计算每个ID分组的平均值和标准偏差

df.groupby('A').agg({'B': ['mean', 'std']})
      B          
   mean       std
A                
1   3.0       NaN
2   3.5  3.535534
4   6.0       NaN
6   5.5  2.121320
7   1.5  0.707107
8   2.5  0.707107
你读过groupby上的吗?