Python 如何查找相关性大于0.50的属性
在分析数据集之后,我们如何找到所有属性的相关性Python 如何查找相关性大于0.50的属性,python,pandas,machine-learning,decision-tree,Python,Pandas,Machine Learning,Decision Tree,在分析数据集之后,我们如何找到所有属性的相关性 correlations = data.corr(method='pearson') print(correlation>=0.50) 我没有得到正确的输出。数据: import pprint np.random.seed(4) df = pd.DataFrame(np.random.standard_normal((1000, 5))) df.columns = list("ABCDE") df_cor = df.c
correlations = data.corr(method='pearson')
print(correlation>=0.50)
我没有得到正确的输出。数据:
import pprint
np.random.seed(4)
df = pd.DataFrame(np.random.standard_normal((1000, 5)))
df.columns = list("ABCDE")
df_cor = df.corr(method='pearson')
df.head():
df_cor:
A B C D E
A 1.000000 -0.008658 -0.015977 -0.001219 -0.008043
B -0.008658 1.000000 0.037419 -0.055335 0.057751
C -0.015977 0.037419 1.000000 0.000049 0.057091
D -0.001219 -0.055335 0.000049 1.000000 -0.017879
E -0.008043 0.057751 0.057091 -0.017879 1.000000
如果需要数据帧输出:
df_cor[df_cor.abs() > .05].replace(1, np.nan)
删除没有值的列后:
df_cor[df_cor.abs() > .05].replace(1, np.nan).dropna(how='all', axis=1)
你能帮助我进行5次交叉验证,并使用决策树评估模型中的精确度、召回率和f1分数吗
{'B': {'D': -0.0553348494117175, 'E': 0.057751329924049855},
'C': {'E': 0.057091148280687266},
'D': {'B': -0.0553348494117175},
'E': {'B': 0.057751329924049855, 'C': 0.057091148280687266}}
df_cor[df_cor.abs() > .05].replace(1, np.nan)
A B C D E
A NaN NaN NaN NaN NaN
B NaN NaN NaN -0.055335 0.057751
C NaN NaN NaN NaN 0.057091
D NaN -0.055335 NaN NaN NaN
E NaN 0.057751 0.057091 NaN NaN
df_cor[df_cor.abs() > .05].replace(1, np.nan).dropna(how='all', axis=1)
B C D E
A NaN NaN NaN NaN
B NaN NaN -0.055335 0.057751
C NaN NaN NaN 0.057091
D -0.055335 NaN NaN NaN
E 0.057751 0.057091 NaN NaN