Python 如何计算数据帧列表的统计信息
我有一个数据帧列表,所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做 编辑: 假设三个数据帧的列表<代码> DFS < /代码>,并考虑均值函数。结果应该是一个数据帧Python 如何计算数据帧列表的统计信息,python,pandas,dataframe,concatenation,Python,Pandas,Dataframe,Concatenation,我有一个数据帧列表,所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做 编辑: 假设三个数据帧的列表 DFS < /代码>,并考虑均值函数。结果应该是一个数据帧DF_-mean,元素中的值DF_-mean[index0,col0]=DFS[0][index0,col0]+DFS[1][index0,col0]+DFS[2][index0,col0]/3我建议将其用于此类内容。(见更新) 然后,您可以在轴=0上应用描述性统计功能: pnl.std(axis=0) Out:
DF_-mean
,元素中的值DF_-mean[index0,col0]=DFS[0][index0,col0]+DFS[1][index0,col0]+DFS[2][index0,col0]/3
我建议将其用于此类内容。(见更新)
然后,您可以在轴=0上应用描述性统计功能:
pnl.std(axis=0)
Out:
0 1 2 3 4
0 2.886751 2.081666 1.527525 2.516611 0.577350
1 2.081666 3.214550 2.645751 1.154701 2.516611
2 3.214550 4.041452 3.785939 2.645751 4.163332
3 3.511885 2.309401 1.527525 3.785939 0.577350
4 4.509250 4.163332 2.081666 1.732051 2.309401
5 1.000000 3.000000 2.081666 2.645751 3.000000
6 2.000000 1.527525 2.886751 1.527525 2.886751
7 2.645751 2.516611 2.516611 1.732051 0.577350
8 4.509250 0.577350 4.041452 2.081666 1.527525
9 1.527525 3.785939 2.516611 1.000000 1.154701
更新:
。在这种情况下,最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat,它将使用字典键作为函数的keys参数
dfs_combined=pd.concat(dfs)
现在,如果取1级的标准偏差,结果将相同:
dfs_combined.std(level=1)
Out:
0 1 2 3 4
0 2.886751 2.081666 1.527525 2.516611 0.577350
1 2.081666 3.214550 2.645751 1.154701 2.516611
2 3.214550 4.041452 3.785939 2.645751 4.163332
3 3.511885 2.309401 1.527525 3.785939 0.577350
4 4.509250 4.163332 2.081666 1.732051 2.309401
5 1.000000 3.000000 2.081666 2.645751 3.000000
6 2.000000 1.527525 2.886751 1.527525 2.886751
7 2.645751 2.516611 2.516611 1.732051 0.577350
8 4.509250 0.577350 4.041452 2.081666 1.527525
9 1.527525 3.785939 2.516611 1.000000 1.154701
我建议你用这些东西。(见更新)
然后,您可以在轴=0上应用描述性统计功能:
pnl.std(axis=0)
Out:
0 1 2 3 4
0 2.886751 2.081666 1.527525 2.516611 0.577350
1 2.081666 3.214550 2.645751 1.154701 2.516611
2 3.214550 4.041452 3.785939 2.645751 4.163332
3 3.511885 2.309401 1.527525 3.785939 0.577350
4 4.509250 4.163332 2.081666 1.732051 2.309401
5 1.000000 3.000000 2.081666 2.645751 3.000000
6 2.000000 1.527525 2.886751 1.527525 2.886751
7 2.645751 2.516611 2.516611 1.732051 0.577350
8 4.509250 0.577350 4.041452 2.081666 1.527525
9 1.527525 3.785939 2.516611 1.000000 1.154701
更新:
。在这种情况下,最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat,它将使用字典键作为函数的keys参数
dfs_combined=pd.concat(dfs)
现在,如果取1级的标准偏差,结果将相同:
dfs_combined.std(level=1)
Out:
0 1 2 3 4
0 2.886751 2.081666 1.527525 2.516611 0.577350
1 2.081666 3.214550 2.645751 1.154701 2.516611
2 3.214550 4.041452 3.785939 2.645751 4.163332
3 3.511885 2.309401 1.527525 3.785939 0.577350
4 4.509250 4.163332 2.081666 1.732051 2.309401
5 1.000000 3.000000 2.081666 2.645751 3.000000
6 2.000000 1.527525 2.886751 1.527525 2.886751
7 2.645751 2.516611 2.516611 1.732051 0.577350
8 4.509250 0.577350 4.041452 2.081666 1.527525
9 1.527525 3.785939 2.516611 1.000000 1.154701