Python 3.x 计算来自不同数据帧的单元格的平均值_Python 3.x_Pandas_Dataframe

Python 3.x 计算来自不同数据帧的单元格的平均值

python-3.x pandas dataframe

Python 3.x 计算来自不同数据帧的单元格的平均值,python-3.x,pandas,dataframe,Python 3.x,Pandas,Dataframe,我想计算来自不同数据帧的多个单元格的平均值。我已经用df.corr（）计算了变量之间的相关性，我必须再做9次，然后计算每个变量的相关性平均值例如，我得到的第一个具有相关性的数据帧可能是： a b c __________________ a 1 0.2 0.3 b 0.2 1 0.4 c 0.3 0.4 1 a b c __________________ a 1 0.3 0.2 b 0

我想计算来自不同数据帧的多个单元格的平均值。我已经用

df.corr（）

计算了变量之间的相关性，我必须再做9次，然后计算每个变量的相关性平均值

例如，我得到的第一个具有相关性的数据帧可能是：

    a    b    c  
__________________

a  1   0.2   0.3

b  0.2   1   0.4

c  0.3   0.4  1

    a    b    c  
__________________

a  1   0.3   0.2

b  0.3   1   0.4

c  0.2  0.4  1

第二个相关数据帧可以是：

    a    b    c  
__________________

a  1   0.2   0.3

b  0.2   1   0.4

c  0.3   0.4  1

    a    b    c  
__________________

a  1   0.3   0.2

b  0.3   1   0.4

c  0.2  0.4  1

我想得到一个最终的数据帧，其中每个单元的平均值考虑了所有的数据帧


df_result

    a    b    c  
__________________

a  1   0.25   0.25

b  0.25   1   0.4

c  0.25   0.4  1

这很超前，你可以这样做：

（df1.corr（）+df2.corr（））/2

由于两个数据帧具有中指定的相同列

，因此最好使用内置的pandas mean（）方法以获得更好的性能

下面的代码将遍历大量随机生成的数据帧，将每个相关矩阵附加到列表中，然后使用内置的mean（）函数获取平均值

将熊猫作为pd导入
将numpy作为np导入
rs=np.random.RandomState（0）
相关矩阵=[]
对于范围（10）内的uu：
df=pd.DataFrame（rs.rand（3,3））
相关矩阵.append（df.corr（））
相关性=pd.concat（相关性矩阵）。分组依据（级别=0）
平均值=相关性。平均值（）
std_corr=相关度std（）

如果我想计算这些值的标准偏差，我该怎么办？你是说每两个值的标准偏差，比如两个值向量的标准偏差（例如，a，b，这将是标准偏差[0.25,0.3]）？是的，这将是标准偏差介于[0.3,0.2]和[0.4,0.4]之间……这是否回答了你的问题？请注意如何使用内置的pandas mean（）方法，该方法的性能比实现自己的avraging公式要好。在这种情况下，它不起作用。我在下面发布了一个答案，将我提供的stackoverflow链接中的代码应用于您的问题。看起来很好用。