R 如何解释不同的ggplot2密度?

R 如何解释不同的ggplot2密度?,r,ggplot2,R,Ggplot2,我对ggplot中geom_density的以下变体的含义感到困惑: 有人能解释一下这四个电话的区别吗 geom\u密度(aes\u字符串(x=myvar)) geom\u密度(aes\u字符串(x=myvar,y=…密度…) geom\u密度(aes\u字符串(x=myvar,y=…缩放…) geom\u密度(aes\u字符串(x=myvar,y=…count../sum(…count..)) 我的理解是: geom_density单独产生的密度曲线下的面积总和为1 geom_density

我对ggplot中
geom_density
的以下变体的含义感到困惑:

有人能解释一下这四个电话的区别吗

  • geom\u密度(aes\u字符串(x=myvar))
  • geom\u密度(aes\u字符串(x=myvar,y=…密度…)
  • geom\u密度(aes\u字符串(x=myvar,y=…缩放…)
  • geom\u密度(aes\u字符串(x=myvar,y=…count../sum(…count..))
  • 我的理解是:

    • geom_density
      单独产生的密度曲线下的面积总和为1
    • geom_density
      。density.
      基本相同
    • .count../sum(..count..)
      将峰值高度标准化为更像标准化直方图,确保所有高度总和为1
    • 不带分母的
      .count..
      本身只会将每个箱子乘以其中的物品
    • .scaled..
      参数将使密度的最大值为1
    我发现
    .scaled..
    非常违反直觉,如果我对它的解释是正确的,我从未见过它被使用过,所以我想忽略这一点。我主要是想澄清
    geom_density
    和一种规格化密度图之间的区别,我假设这需要
    …count…
    参数。谢谢


    (相关:)

    统计密度的默认美学是
    .density..
    ,因此对
    geom_density
    的调用默认使用
    stat_density
    ,默认情况下将绘制
    y=…density..

    通过查看

    .scaled.
    定义为

    densdf$scaled <- densdf$y / max(densdf$y, na.rm = TRUE)
    

    densdf$scaled Unrelated:您确实需要停止引用
    aes()中的变量。
    。除非你使用的是
    aes\u字符串
    ,否则你不应该这样做。@joran:我使用的是
    aes\u字符串
    ,对不起,我使用的是rpy2,所以它总是
    aes\u字符串
    ,只对好奇的读者有用。对问题进行了编辑,以解决
    aes
    aes\u string
    之间的问题。这个错误不是问题的核心。
    res <- within(results, {
        count[is.na(count)] <- 0
        density <- count / width / sum(abs(count), na.rm=TRUE)
        ncount <- count / max(abs(count), na.rm=TRUE)
        ndensity <- density / max(abs(density), na.rm=TRUE)
      })