R hist中的密度/频率和概率()

R hist中的密度/频率和概率(),r,histogram,R,Histogram,我已经使用了代码 hist(x, probability=TRUE) 这给了我一个y轴,从0到2,命名为密度。我不明白这意味着什么。它是积分为1,求和为1,还是y值等于什么?文档上说“freq=NULL,probability=!freq”,但这对我来说没有意义。如果我不使用probability=TRUE,我会得到y轴上的频率,但图的形状是相同的 您可以将直方图保存到一个变量中并查看它 x=rnorm(1000) h<-hist(x) 默认情况下,它绘制频率(可通过h$counts访

我已经使用了代码

hist(x, probability=TRUE)

这给了我一个y轴,从0到2,命名为密度。我不明白这意味着什么。它是积分为1,求和为1,还是y值等于什么?文档上说“freq=NULL,probability=!freq”,但这对我来说没有意义。如果我不使用probability=TRUE,我会得到y轴上的频率,但图的形状是相同的

您可以将直方图保存到一个变量中并查看它

x=rnorm(1000)
h<-hist(x)
默认情况下,它绘制频率(可通过h$counts访问),这只是每个间隔内的点数。点的总数等于向量的长度,您可以使用该长度进行检查

sum(h$counts)
[1] 1000
如果指定
probability=TRUE
,它将绘制每个间隔内每个点的概率。概率总和乘以钢筋宽度应等于1。在我们的例子中,条形宽度是0.5,所以我们得到

sum(h$density*0.5)
[1] 1

如果
probability=TRUE
给出了问题。对于每个间隔内的每个点,我不理解值如何变大1(我的轴是从0到2的,值大于1)
sum(h$density*0.05)
真的等于1。如果你有一个宽度小于1的条,那么密度确实可以大于1。总概率总是以概率密度乘以区间长度来计算的。啊,好的,现在我知道了。所以问题来了。在第一个区间内的值是h$density[1]*0.05,第二个区间的值是h$density[2]*0.05,等等。谢谢!
sum(h$density*0.5)
[1] 1