Python 如何计算数据帧列表的统计信息_Python_Pandas_Dataframe_Concatenation

Python 如何计算数据帧列表的统计信息

python pandas dataframe

Python 如何计算数据帧列表的统计信息,python,pandas,dataframe,concatenation,Python,Pandas,Dataframe,Concatenation,我有一个数据帧列表，所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做编辑：假设三个数据帧的列表 DFS < /代码>，并考虑均值函数。结果应该是一个数据帧DF_-mean，元素中的值DF_-mean[index0，col0]=DFS[0][index0，col0]+DFS[1][index0，col0]+DFS[2][index0，col0]/3我建议将其用于此类内容。（见更新）然后，您可以在轴=0上应用描述性统计功能： pnl.std(axis=0) Out:

我有一个数据帧列表，所有数据帧都具有相同的键和列。我想计算每个元素的平均值和标准差。我怎么做

编辑：假设三个数据帧的列表<代码> DFS < /代码>，并考虑均值函数。结果应该是一个数据帧

DF_-mean

，元素中的值

DF_-mean[index0，col0]=DFS[0][index0，col0]+DFS[1][index0，col0]+DFS[2][index0，col0]/3

我建议将其用于此类内容。（见更新）

然后，您可以在轴=0上应用描述性统计功能：

pnl.std(axis=0)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701

更新：

。在这种情况下，最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat，它将使用字典键作为函数的keys参数

dfs_combined=pd.concat（dfs）

现在，如果取1级的标准偏差，结果将相同：

dfs_combined.std(level=1)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701

我建议你用这些东西。（见更新）

然后，您可以在轴=0上应用描述性统计功能：

pnl.std(axis=0)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701

更新：

。在这种情况下，最合适的解决方案是连接数据帧并使用多索引。如果将字典传递给pd.concat，它将使用字典键作为函数的keys参数

dfs_combined=pd.concat（dfs）

现在，如果取1级的标准偏差，结果将相同：

dfs_combined.std(level=1)
Out: 
          0         1         2         3         4
0  2.886751  2.081666  1.527525  2.516611  0.577350
1  2.081666  3.214550  2.645751  1.154701  2.516611
2  3.214550  4.041452  3.785939  2.645751  4.163332
3  3.511885  2.309401  1.527525  3.785939  0.577350
4  4.509250  4.163332  2.081666  1.732051  2.309401
5  1.000000  3.000000  2.081666  2.645751  3.000000
6  2.000000  1.527525  2.886751  1.527525  2.886751
7  2.645751  2.516611  2.516611  1.732051  0.577350
8  4.509250  0.577350  4.041452  2.081666  1.527525
9  1.527525  3.785939  2.516611  1.000000  1.154701