Python 如何查找相关性大于0.50的属性

Python 如何查找相关性大于0.50的属性,python,pandas,machine-learning,decision-tree,Python,Pandas,Machine Learning,Decision Tree,在分析数据集之后,我们如何找到所有属性的相关性 correlations = data.corr(method='pearson') print(correlation>=0.50) 我没有得到正确的输出。数据: import pprint np.random.seed(4) df = pd.DataFrame(np.random.standard_normal((1000, 5))) df.columns = list("ABCDE") df_cor = df.c

在分析数据集之后,我们如何找到所有属性的相关性

correlations = data.corr(method='pearson')

print(correlation>=0.50)
我没有得到正确的输出。

数据:

import pprint
np.random.seed(4)
df = pd.DataFrame(np.random.standard_normal((1000, 5)))
df.columns = list("ABCDE")
df_cor = df.corr(method='pearson')
df.head():

df_cor:

          A         B         C         D         E
A  1.000000 -0.008658 -0.015977 -0.001219 -0.008043
B -0.008658  1.000000  0.037419 -0.055335  0.057751
C -0.015977  0.037419  1.000000  0.000049  0.057091
D -0.001219 -0.055335  0.000049  1.000000 -0.017879
E -0.008043  0.057751  0.057091 -0.017879  1.000000
如果需要数据帧输出:

df_cor[df_cor.abs() > .05].replace(1, np.nan)
删除没有值的列后:

df_cor[df_cor.abs() > .05].replace(1, np.nan).dropna(how='all', axis=1)

你能帮助我进行5次交叉验证,并使用决策树评估模型中的精确度、召回率和f1分数吗
{'B': {'D': -0.0553348494117175, 'E': 0.057751329924049855},
 'C': {'E': 0.057091148280687266},
 'D': {'B': -0.0553348494117175},
 'E': {'B': 0.057751329924049855, 'C': 0.057091148280687266}}
df_cor[df_cor.abs() > .05].replace(1, np.nan)
    A         B         C         D         E
A NaN       NaN       NaN       NaN       NaN
B NaN       NaN       NaN -0.055335  0.057751
C NaN       NaN       NaN       NaN  0.057091
D NaN -0.055335       NaN       NaN       NaN
E NaN  0.057751  0.057091       NaN       NaN
df_cor[df_cor.abs() > .05].replace(1, np.nan).dropna(how='all', axis=1)
          B         C         D         E
A       NaN       NaN       NaN       NaN
B       NaN       NaN -0.055335  0.057751
C       NaN       NaN       NaN  0.057091
D -0.055335       NaN       NaN       NaN
E  0.057751  0.057091       NaN       NaN