Python 如何计算数据帧列表的统计信息

Python 如何计算数据帧列表的统计信息,python,pandas,dataframe,concatenation,Python,Pandas,Dataframe,Concatenation,我有一个数据帧列表,所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做 编辑: 假设三个数据帧的列表 DFS < /代码>,并考虑均值函数。结果应该是一个数据帧DF_-mean,元素中的值DF_-mean[index0,col0]=DFS[0][index0,col0]+DFS[1][index0,col0]+DFS[2][index0,col0]/3我建议将其用于此类内容。(见更新) 然后,您可以在轴=0上应用描述性统计功能: pnl.std(axis=0) Out:

我有一个数据帧列表,所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做

编辑: 假设三个数据帧的列表<代码> DFS < /代码>,并考虑均值函数。结果应该是一个数据帧
DF_-mean
,元素中的值
DF_-mean[index0,col0]=DFS[0][index0,col0]+DFS[1][index0,col0]+DFS[2][index0,col0]/3
我建议将其用于此类内容。(见更新)

然后,您可以在轴=0上应用描述性统计功能:

pnl.std(axis=0)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701
更新:

。在这种情况下,最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat,它将使用字典键作为函数的keys参数

dfs_combined=pd.concat(dfs)

现在,如果取1级的标准偏差,结果将相同:

dfs_combined.std(level=1)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701
我建议你用这些东西。(见更新)

然后,您可以在轴=0上应用描述性统计功能:

pnl.std(axis=0)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701
更新:

。在这种情况下,最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat,它将使用字典键作为函数的keys参数

dfs_combined=pd.concat(dfs)

现在,如果取1级的标准偏差,结果将相同:

dfs_combined.std(level=1)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701