Python 大量变量之间的相关性
我有一个包含30个变量的数据框架,我想看看其中哪些变量是相关的。我使用了df.corr(),但结果似乎很难理解,因为它包含一个大矩阵Python 大量变量之间的相关性,python,pandas,Python,Pandas,我有一个包含30个变量的数据框架,我想看看其中哪些变量是相关的。我使用了df.corr(),但结果似乎很难理解,因为它包含一个大矩阵 有没有办法从中构建热图,或者获得相关系数大于或小于某个固定值的相关对(例如-r0.8)?seaborn软件包具有创建热图的出色功能 下面是一段示例代码,用于生成相关矩阵的热图 df= pd.DataFrame(np.random.randint(1,4,[72,5])) df.columns = ['col1','col2','col3','col4','col5
有没有办法从中构建热图,或者获得相关系数大于或小于某个固定值的相关对(例如-r<-0.8&r>0.8)?seaborn软件包具有创建热图的出色功能 下面是一段示例代码,用于生成相关矩阵的热图
df= pd.DataFrame(np.random.randint(1,4,[72,5]))
df.columns = ['col1','col2','col3','col4','col5']
import seaborn as sns
sns.heatmap(df.corr())
plt.yticks(rotation= 0)
plt.xticks(rotation=90)
您的问题可能会被标记,除非您能更具体地说明什么是有用的输出。你想要一张热图,或者只返回最高的n个相关对,等等?尽量使问题更直接,而不是询问主观建议。我建议删除您的问题,然后以更清晰的方式再次提问。根据您的需要,您可以尝试将每个变量相互关联。。。或者使用PCA或自动编码器降低维数。。。