R 当分布中存在异常值时,我应该如何使用'mean'函数?

R 当分布中存在异常值时,我应该如何使用'mean'函数?,r,statistics,average,mean,R,Statistics,Average,Mean,对于一个项目,我每次都需要得到一个平均值,这意味着我用它来比较零假设H0下的分布。但是有时候一些值(很少)比所有其他值大得多,所以如果我使用基本算术平均值,这些值将大大影响最终的平均值 这里有一个例子 这里,如果我做一个算术平均值,我得到大约90,而实际上,我们可以看到轴上的绝大多数值都在50左右 您对这种情况下使用的平均值有什么想法?1。使用中间带 中值(x) 中位数是一个汇总统计数据,不会被异常值“抛出” 2.使用修剪平均值 平均值(x,trim=.05) 修剪平均值是除最高和最低n%中的

对于一个项目,我每次都需要得到一个平均值,这意味着我用它来比较
零假设H0下的分布。
但是有时候一些值(很少)比所有其他值大得多,所以如果我使用基本算术平均值,这些值将大大影响最终的平均值

这里有一个例子

这里,如果我做一个算术平均值,我得到大约90,而实际上,我们可以看到轴上的绝大多数值都在50左右

您对这种情况下使用的平均值有什么想法?

1。使用中间带
中值(x)

中位数是一个汇总统计数据,不会被异常值“抛出”

2.使用修剪平均值
平均值(x,trim=.05)

修剪平均值是除最高和最低
n
%中的值外的所有值的平均值,其中
n
是您选择的值。上面的代码将返回
x
中每个值的平均值,最高5%和最低5%除外


无论你做什么,都要确保报告透明。

在这种情况下,计算
中值()
,以消除异常值的影响。把这个问题问@DanielJames我同意这个问题可以在统计数据交换上得到回答,但认为它也合理地针对R?我把它解释为一个关于函数的问题。好的,谢谢,但是几何平均值呢?这也很合适,不是吗?@chippycentra,我不确定。可能是统计溢出的问题