箱线图平均值在R中不正确
我对R中的箱线图平均值在R中不正确,r,R,我对R中的箱线图函数有一个严重的问题。箱线图错误地标记了图形中的中线。尽管平均值为7.2376,但在箱线图上显示为4左右,如下图所示(使用以下代码生成) 数据箱线图(数据) >平均值(数据)=7.2376 它快把我逼疯了。它仅使用此数据集执行此操作。其他数据集,箱线图显示的平均值很好 任何洞察都是值得赞赏的 谢谢。我的评论应该是一个答案 与其说您对box-plot函数感到困惑,不如说您对box-plot的含义感到困惑。A通常只显示五个值:最小值、第一个四分位数、中值、第三个四分位数和最大值(
箱线图
函数有一个严重的问题。箱线图错误地标记了图形中的中线。尽管平均值为7.2376,但在箱线图上显示为4左右,如下图所示(使用以下代码生成)
数据箱线图(数据)
>平均值(数据)=7.2376
它快把我逼疯了。它仅使用此数据集执行此操作。其他数据集,箱线图显示的平均值很好
任何洞察都是值得赞赏的
谢谢。我的评论应该是一个答案 与其说您对
box-plot
函数感到困惑,不如说您对box-plot的含义感到困惑。A通常只显示五个值:最小值、第一个四分位数、中值、第三个四分位数和最大值(此外,大多数绘图算法将根据某些规则分割“异常值”)
因此,方框图中的中间线对应的是中位数,而不是平均值。我必须为这个愚蠢的错误赎罪。对于那些希望标注平均值的用户,您可以执行以下操作:
> DATA_mean <- data.frame(Group ="A", Measure = DATA) #Make a data.frame first
> attach(DATA_mean) #Attach the data
> boxplot( Measure ~ Group) #Draw your boxplot as above
> means <- by(Measure, Group, mean) #Calculate mean and assign
> points(1, means, pch = 21, cex =1.5, bg = "blue") #Label mean on boxplot
#The default center is 1 for the boxplots, if you have more than one, it would be 1:2:3...etc
>DATA_-mean附加(DATA_-mean)#附加数据
>箱线图(测量组)#如上所示绘制箱线图
>平均值点(1,平均值,pch=21,cex=1.5,bg=“蓝色”)#箱线图上的标签平均值
#箱线图的默认中心为1,如果有多个箱线图,则为1:2:3…以此类推
希望这能帮助别人。这对我来说是一个令人尴尬的错误。该睡觉了
谢谢大家马上纠正我的错误 箱线图显示的是中位数(和其他分位数),而不是平均值。当然***这对我来说是个愚蠢的错误。我需要睡一会儿。已经连续两天起床了。谢谢你,天哪!去睡觉吧,看在上帝的份上!:)。。。在你的例子中,
median(DATA)
是3.53,所以boxplot()
正是它应该做的!更正确的是,至少就R而言,指的是下铰链和上铰链,而不是第1和第3四分位数(第25和第75个分位数),因为辛普森有多个分位数等+1的定义:铰链
!=<代码>四分位数。我想四分位数的定义可能会偶尔出现歧义,但我相当怀疑这种情况会经常发生。铰链是四分位值中最极端的实际值,因此,是否以各种方式插值不应影响铰链。
> DATA_mean <- data.frame(Group ="A", Measure = DATA) #Make a data.frame first
> attach(DATA_mean) #Attach the data
> boxplot( Measure ~ Group) #Draw your boxplot as above
> means <- by(Measure, Group, mean) #Calculate mean and assign
> points(1, means, pch = 21, cex =1.5, bg = "blue") #Label mean on boxplot
#The default center is 1 for the boxplots, if you have more than one, it would be 1:2:3...etc