Python 分组皮尔逊相关
我有一个大数据框(形状100000*192)。我已经计算了每个属性的皮尔逊系数。现在我正在寻找一种计算各组皮尔逊相关性的方法。 我的意思是现在我有Python 分组皮尔逊相关,python,pandas,correlation,pearson,Python,Pandas,Correlation,Pearson,我有一个大数据框(形状100000*192)。我已经计算了每个属性的皮尔逊系数。现在我正在寻找一种计算各组皮尔逊相关性的方法。 我的意思是现在我有 if A then B 我想计算一下 if (A AND B) then C if (A AND B AND C) then (D AND E) 比如说 DataFrame 1 A B C 0|0 0 1 1|1 0 0 2|0 1 0 3|1 1 1 这里A列和C列似乎没有很强的相关性,A和
if A then B
我想计算一下
if (A AND B) then C
if (A AND B AND C) then (D AND E)
比如说
DataFrame 1
A B C
0|0 0 1
1|1 0 0
2|0 1 0
3|1 1 1
这里A列和C列似乎没有很强的相关性,A和B或B和C都没有,但是当你取A和B时,你与C有相关性(如果A=B,那么C=1,否则C=0)。我希望这有助于理解
是否有任何函数或库已经在这样做,或者我将不得不在我的数据帧上使用
pandas
的df.corr()
函数编写大量迭代?您的逻辑表达式与“分组”pearson相关性有什么关系?你能举一个具体的例子说明你在谈论什么,并提供你期望看到的东西吗。阅读我试图解释什么是分组相关性。现在我有属性之间的相关性,但只有1:1。我想知道2对1,2对2等的系数,以及192个属性给出的所有可能性。更清楚吗?我要举个例子不,不是。你读过我链接的文档了吗?我用示例编辑过