Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/83.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
trim参数在mean()函数中代表什么?_R - Fatal编程技术网

trim参数在mean()函数中代表什么?

trim参数在mean()函数中代表什么?,r,R,我就是不明白修剪的概念。起初我以为是把数字四舍五入,但这没有意义。有人能澄清trim在这里做什么吗 # The linkedin and facebook vectors have already been created for you linkedin <- c(16, 9, 13, 5, 2, 17, 14) facebook <- c(17, 7, 5, 16, 8, 13, 14) # Calculate the mean of the sum avg_sum <-

我就是不明白修剪的概念。起初我以为是把数字四舍五入,但这没有意义。有人能澄清trim在这里做什么吗

# The linkedin and facebook vectors have already been created for you
linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)

# Calculate the mean of the sum
avg_sum <- mean(c(linkedin+facebook))

# Calculate the trimmed mean of the sum
avg_sum_trimmed <- mean(c(linkedin+facebook), trim = 0.2)

# Inspect both new variables
avg_sum
[1] 22.28571
avg_sum_trimmed
[1] 22.6
#linkedin和facebook矢量已经为您创建

linkedin根据
?平均值

修剪-在计算平均值之前,从x的每一端修剪观测值的分数(0到0.5)。超出该范围的修剪值将作为最近的端点

如果我们使用向量“v1”

v1 <- c(linkedin + facebook)
sort
ed
vector
的任意一端移除20%的观察值大约是移除的第一个和最后一个观察值

mean(v2[-c(1, 7)])
#[1] 22.6
这等于

mean(v1, trim = 0.2)
#[1] 22.6
-使用
trim=0.4检查

mean(v2[-c(1:2, 6:7)])
#[1] 22.33333
mean(v1, trim = 0.4)
#[1] 22.33333

根据
?平均值

修剪-在计算平均值之前,从x的每一端修剪观测值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点

如果我们使用向量“v1”

v1 <- c(linkedin + facebook)
sort
ed
vector
的任意一端移除20%的观察值大约是移除的第一个和最后一个观察值

mean(v2[-c(1, 7)])
#[1] 22.6
这等于

mean(v1, trim = 0.2)
#[1] 22.6
-使用
trim=0.4检查

mean(v2[-c(1:2, 6:7)])
#[1] 22.33333
mean(v1, trim = 0.4)
#[1] 22.33333

您显示的代码看起来像来自Datacamp的Intermediate R的一个示例。不幸的是,该类没有进一步解释修剪的含义以及您实际应该使用它的时间。我还发现自己对为什么要使用它感到非常困惑。以下是我的发现:

首先,修剪平均值是中心趋势的稳健估计值。它的计算非常简单,因为你只需1)在分布的每一侧移除预定数量的观测值,然后2)平均剩余的观测值。 这样,通过消除不对称分布两侧的一些观测值,大部分观测值的修剪平均值估计效果更好,其标准误差受离群值的影响更小(与“传统”平均值相比)

让我们看看您提供的Datacamp示例:

linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)

您显示的代码看起来像来自Datacamp的Intermediate R的示例。不幸的是,这个类没有进一步解释修剪的意思是什么,也没有解释你应该何时实际使用它。我也发现自己对我们为什么要使用它感到很困惑。以下是我的发现:

首先,修剪均值是中心趋势的稳健估计。它的计算非常简单,因为你只需要1)在分布的每一侧移除预定数量的观测值,然后2)平均剩余的观测值。 这样,通过消除不对称分布两侧的一些观测值,大部分观测值的修剪平均值估计效果更好,其标准误差受离群值的影响更小(与“传统”平均值相比)

让我们看看您提供的Datacamp示例:

linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)

如果您选中“平均值”
修剪-在计算平均值之前,从x的每一端修剪的观察值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点。
我仍在努力理解。因此,它会删除距离平均值(x)最远的20%的值?或者类似的东西,如果你检查
?mean
trim-在计算平均值之前,从x的每一端修剪观察值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点。
我仍在努力理解。因此,它会删除距离平均值(x)最远的20%的值?或者类似的