R hist中的密度/频率和概率（）_R_Histogram

R hist中的密度/频率和概率（）

R hist中的密度/频率和概率（）,r,histogram,R,Histogram,我已经使用了代码 hist(x, probability=TRUE) 这给了我一个y轴，从0到2，命名为密度。我不明白这意味着什么。它是积分为1，求和为1，还是y值等于什么？文档上说“freq=NULL，probability=！freq”，但这对我来说没有意义。如果我不使用probability=TRUE，我会得到y轴上的频率，但图的形状是相同的您可以将直方图保存到一个变量中并查看它 x=rnorm(1000) h<-hist(x) 默认情况下，它绘制频率（可通过h$counts访

我已经使用了代码

hist(x, probability=TRUE)

这给了我一个y轴，从0到2，命名为密度。我不明白这意味着什么。它是积分为1，求和为1，还是y值等于什么？文档上说“freq=NULL，probability=！freq”，但这对我来说没有意义。如果我不使用probability=TRUE，我会得到y轴上的频率，但图的形状是相同的

您可以将直方图保存到一个变量中并查看它

x=rnorm(1000)
h<-hist(x)

默认情况下，它绘制频率（可通过h$counts访问），这只是每个间隔内的点数。点的总数等于向量的长度，您可以使用该长度进行检查

sum(h$counts)
[1] 1000

如果指定

probability=TRUE

，它将绘制每个间隔内每个点的概率。概率总和乘以钢筋宽度应等于1。在我们的例子中，条形宽度是0.5，所以我们得到

sum(h$density*0.5)
[1] 1

如果

probability=TRUE

给出了问题。对于每个间隔内的每个点，我不理解值如何变大1（我的轴是从0到2的，值大于1）

sum（h$density*0.05）

真的等于1。如果你有一个宽度小于1的条，那么密度确实可以大于1。总概率总是以概率密度乘以区间长度来计算的。啊，好的，现在我知道了。所以问题来了。在第一个区间内的值是h$density[1]*0.05，第二个区间的值是h$density[2]*0.05，等等。谢谢！

sum(h$density*0.5)
[1] 1