Pandas 使用熊猫绘制最高相关性
我一直在用下面的代码通过热图绘制相关性。但是,变量太多了。是否有可能在图表上绘制出最高相关性(大于0.5和-0.5)Pandas 使用熊猫绘制最高相关性,pandas,correlation,Pandas,Correlation,我一直在用下面的代码通过热图绘制相关性。但是,变量太多了。是否有可能在图表上绘制出最高相关性(大于0.5和-0.5) plt.rcParams['figure.figsize'] = [80,80] corr3 = datasetcm.corr() fig = plt.figure() ax = fig.add_subplot(111) cax = ax.matshow(corr3,cmap='coolwarm', vmin=-1, vmax=1) fig.colorbar(cax) tic
plt.rcParams['figure.figsize'] = [80,80]
corr3 = datasetcm.corr()
fig = plt.figure()
ax = fig.add_subplot(111)
cax = ax.matshow(corr3,cmap='coolwarm', vmin=-1, vmax=1)
fig.colorbar(cax)
ticks = np.arange(0,len(datasetcm.columns),1)
ax.set_xticks(ticks)
plt.xticks(rotation=90)
ax.set_yticks(ticks)
ax.set_xticklabels(datasetcm.columns)
ax.set_yticklabels(datasetcm.columns)
plt.show()
打印前,在0.5的树状图上过滤相关矩阵。对于低于
0.5
的相关性,这将返回0
然后,我们可以使用颜色映射将带有0的行显示为不相关
corr3 = datasetcm.corr()
corr3 = corr3 [corr3 > 0.5].fillna(0)
corr3.style.background_gradient(cmap='coolwarm', axis=None).set_precision(2)
嗨,尔凡,谢谢你的回复。这仍然让我在热图上看到两个多变量,很难分辨。我想从热图中删除不相关的变量,你自己怎么看?因此,如果它有任何相关性<0.5,您想删除它吗?因为它可能总是有一些变量,它与这些变量的相关性大于0.5。是的,我明白你的意思。我认为表格格式是更好的选择。谢谢你的帮助