R 如何解释不同的ggplot2密度?
我对ggplot中R 如何解释不同的ggplot2密度?,r,ggplot2,R,Ggplot2,我对ggplot中geom_density的以下变体的含义感到困惑: 有人能解释一下这四个电话的区别吗 geom\u密度(aes\u字符串(x=myvar)) geom\u密度(aes\u字符串(x=myvar,y=…密度…) geom\u密度(aes\u字符串(x=myvar,y=…缩放…) geom\u密度(aes\u字符串(x=myvar,y=…count../sum(…count..)) 我的理解是: geom_density单独产生的密度曲线下的面积总和为1 geom_density
geom_density
的以下变体的含义感到困惑:
有人能解释一下这四个电话的区别吗
geom\u密度(aes\u字符串(x=myvar))
geom\u密度(aes\u字符串(x=myvar,y=…密度…)
geom\u密度(aes\u字符串(x=myvar,y=…缩放…)
geom\u密度(aes\u字符串(x=myvar,y=…count../sum(…count..))
单独产生的密度曲线下的面积总和为1geom_density
与geom_density
基本相同李>。density.
将峰值高度标准化为更像标准化直方图,确保所有高度总和为1.count../sum(..count..)
- 不带分母的
本身只会将每个箱子乘以其中的物品.count..
参数将使密度的最大值为1.scaled..
.scaled..
非常违反直觉,如果我对它的解释是正确的,我从未见过它被使用过,所以我想忽略这一点。我主要是想澄清geom_density
和一种规格化密度图之间的区别,我假设这需要…count…
参数。谢谢
(相关:)统计密度的默认美学是
.density..
,因此对geom_density
的调用默认使用stat_density
,默认情况下将绘制y=…density..
通过查看
.scaled.
定义为
densdf$scaled <- densdf$y / max(densdf$y, na.rm = TRUE)
densdf$scaled Unrelated:您确实需要停止引用aes()中的变量。
。除非你使用的是aes\u字符串
,否则你不应该这样做。@joran:我使用的是aes\u字符串
,对不起,我使用的是rpy2,所以它总是aes\u字符串
,只对好奇的读者有用。对问题进行了编辑,以解决aes
与aes\u string
之间的问题。这个错误不是问题的核心。
res <- within(results, {
count[is.na(count)] <- 0
density <- count / width / sum(abs(count), na.rm=TRUE)
ncount <- count / max(abs(count), na.rm=TRUE)
ndensity <- density / max(abs(density), na.rm=TRUE)
})