Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/276.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 大量变量之间的相关性_Python_Pandas - Fatal编程技术网

Python 大量变量之间的相关性

Python 大量变量之间的相关性,python,pandas,Python,Pandas,我有一个包含30个变量的数据框架,我想看看其中哪些变量是相关的。我使用了df.corr(),但结果似乎很难理解,因为它包含一个大矩阵 有没有办法从中构建热图,或者获得相关系数大于或小于某个固定值的相关对(例如-r0.8)?seaborn软件包具有创建热图的出色功能 下面是一段示例代码,用于生成相关矩阵的热图 df= pd.DataFrame(np.random.randint(1,4,[72,5])) df.columns = ['col1','col2','col3','col4','col5

我有一个包含30个变量的数据框架,我想看看其中哪些变量是相关的。我使用了df.corr(),但结果似乎很难理解,因为它包含一个大矩阵


有没有办法从中构建热图,或者获得相关系数大于或小于某个固定值的相关对(例如-r<-0.8&r>0.8)?

seaborn软件包具有创建热图的出色功能

下面是一段示例代码,用于生成相关矩阵的热图

df= pd.DataFrame(np.random.randint(1,4,[72,5]))
df.columns = ['col1','col2','col3','col4','col5']
import seaborn as sns
sns.heatmap(df.corr())
plt.yticks(rotation= 0)
plt.xticks(rotation=90)

您的问题可能会被标记,除非您能更具体地说明什么是有用的输出。你想要一张热图,或者只返回最高的n个相关对,等等?尽量使问题更直接,而不是询问主观建议。我建议删除您的问题,然后以更清晰的方式再次提问。根据您的需要,您可以尝试将每个变量相互关联。。。或者使用PCA或自动编码器降低维数。。。