如何解释corrplot的输出?

如何解释corrplot的输出?,r,plot,statistics,data-visualization,r-corrplot,R,Plot,Statistics,Data Visualization,R Corrplot,这些软件包提供了一些简洁的绘图和带有示例的文档 但我不理解输出。我可以看到,如果你有一个矩阵a_ij,你可以通过n正方形瓷砖将其绘制成n的排列,其中瓷砖ij的颜色对应于a_ij的值。但有些例子似乎有更多方面: 这里我们可以猜测颜色表示相关系数,椭圆的方向是负/正相关的。什么是怪癖 for方法说明: 要使用的相关矩阵的可视化方法。目前,它支持七种方法,分别命名为“圆”(默认)、“正方形”、“椭圆”、“数字”、“饼图”、“阴影”和“颜色”。有关详细信息,请参见示例 圆圈或正方形的面积表示相应相关系

这些软件包提供了一些简洁的绘图和带有示例的文档

但我不理解输出。我可以看到,如果你有一个矩阵
a_ij
,你可以通过
n
正方形瓷砖将其绘制成
n
的排列,其中瓷砖
ij
的颜色对应于
a_ij
的值。但有些例子似乎有更多方面:

这里我们可以猜测颜色表示相关系数,椭圆的方向是负/正相关的。什么是怪癖

for
方法
说明:

要使用的相关矩阵的可视化方法。目前,它支持七种方法,分别命名为“圆”(默认)、“正方形”、“椭圆”、“数字”、“饼图”、“阴影”和“颜色”。有关详细信息,请参见示例

圆圈或正方形的面积表示相应相关系数的绝对值。方法“派”和“阴影”来自Michael Friendly的工作(增加了一些阴影调整),而“椭圆”来自D.J.Murdoch和E.D.Chow的工作,见参考资料部分


所以我们知道,对于圆和正方形,面积应该表示系数。那么其他维度和其他方法呢?

我认为这个图是不言自明的。在右侧,您有
刻度
,其颜色从红色(负相关)变为蓝色(正相关)。颜色根据相关性的强度遵循渐变

如果椭圆向右倾斜,则再次为正相关;如果椭圆向左倾斜,则为负相关

线周围的扩散(表示完全相关,例如mpg~mpg)创建椭圆。你们将有一个更扩散的椭圆,以降低相关性的强度。这通常是弱相关关系在散点图中的表现。然而,我认为这些都是漫画

下面是负责绘制椭圆的
corrplot
函数中的一些代码。我不会试图解释这一点(因为这是一个更大系统的一部分)。如果你想深入研究的话,我想向你展示一下逻辑:

if (method == "ellipse" & plotCI == "n") {
    ell.dat <- function(rho, length = 99) {
        k <- seq(0, 2 * pi, length = length)
        x <- cos(k + acos(rho)/2)/2
        y <- cos(k - acos(rho)/2)/2
        return(cbind(rbind(x, y), c(NA, NA)))
    }
    ELL.dat <- lapply(DAT, ell.dat)
    ELL.dat2 <- 0.85 * matrix(unlist(ELL.dat), ncol = 2, 
        byrow = TRUE)
    ELL.dat2 <- ELL.dat2 + Pos[rep(1:length(DAT), each = 100), 
        ]
    polygon(ELL.dat2, border = col.border, col = col.fill)
}
if(方法==“椭圆”&plotCI==“n”){

ell.dat图中只显示了一个维度

Michael Friendly在《Corrgrams:corrplot相关矩阵探索性显示》(Corrgrams:corrplot
文档混淆地将其称为他的“工作”)中说:

在阴影行中,根据相关性符号,每个单元格都被着色为蓝色或红色,颜色强度按相关性大小的比例缩放0–100%。(使用RGB编码从红色(1,0,0),到白色(1,1,1),再到蓝色(0,0,1),可以很容易地计算这种缩放颜色.为了简单起见,我们忽略了颜色再现和感知的非线性,但请注意,这些很容易在颜色映射函数中适应。)添加白色对角线,以便在黑色和白色中仍然可以识别相关性的方向。选择此颜色双极标度是为了使相关性在0附近为空(白色),并使大小相等的正值和负值近似地具有相同强度的阴影。灰度和其他颜色方案在我们的软件中实现(第6节),但此处未说明

条形符号和圆形符号也使用相同的缩放颜色,但填充的区域与相关性的绝对值成比例。对于条形符号,负值从底部填充,正值从顶部填充。圆圈顺时针填充正值,逆时针填充负值。椭圆具有其ec中心度参数化地缩放到相关值(Murdoch和Chow,1996)。与其他图示符相比,在感知上,随着相关程度的增加,它们在视觉上变得不那么突出

(强调矿山)

“Murdoch and Chow,1996”是一份描述绘制椭圆方程(大型相关矩阵的图形显示)的出版物。椭圆显然是二元正态分布的漫画:


因此,总之,所示的唯一的维度始终是相关系数(或者用问题的术语来说,
aij
的值)本身。多个外观尺寸是冗余的。

您是否阅读了您提供的链接?当相关性等于1和相关性等于0.2时,比较形状。颜色是相关系数。我同意此图提供的信息中存在冗余。您如何将其称为“扩散”计算?@Superbest:我认为你应该先在没有软件包的情况下绘制一些相关变量。这会让你很好地了解散点图应该是什么样子。很好的发现。数学也会转化为R代码。但是,什么是多维度?@asb几何图形的各个方面,例如颜色、大小、偏心度(如果是椭圆)旋转、着色、高度、填充%(如果是饼图)可以说是表示数据的维度。