trim参数在mean()函数中代表什么?
我就是不明白修剪的概念。起初我以为是把数字四舍五入,但这没有意义。有人能澄清trim在这里做什么吗trim参数在mean()函数中代表什么?,r,R,我就是不明白修剪的概念。起初我以为是把数字四舍五入,但这没有意义。有人能澄清trim在这里做什么吗 # The linkedin and facebook vectors have already been created for you linkedin <- c(16, 9, 13, 5, 2, 17, 14) facebook <- c(17, 7, 5, 16, 8, 13, 14) # Calculate the mean of the sum avg_sum <-
# The linkedin and facebook vectors have already been created for you
linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)
# Calculate the mean of the sum
avg_sum <- mean(c(linkedin+facebook))
# Calculate the trimmed mean of the sum
avg_sum_trimmed <- mean(c(linkedin+facebook), trim = 0.2)
# Inspect both new variables
avg_sum
[1] 22.28571
avg_sum_trimmed
[1] 22.6
#linkedin和facebook矢量已经为您创建
linkedin根据?平均值
修剪-在计算平均值之前,从x的每一端修剪观测值的分数(0到0.5)。超出该范围的修剪值将作为最近的端点
如果我们使用向量“v1”
v1 <- c(linkedin + facebook)
从sort
edvector
的任意一端移除20%的观察值大约是移除的第一个和最后一个观察值
mean(v2[-c(1, 7)])
#[1] 22.6
这等于
mean(v1, trim = 0.2)
#[1] 22.6
-使用trim=0.4检查
mean(v2[-c(1:2, 6:7)])
#[1] 22.33333
mean(v1, trim = 0.4)
#[1] 22.33333
根据?平均值
修剪-在计算平均值之前,从x的每一端修剪观测值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点
如果我们使用向量“v1”
v1 <- c(linkedin + facebook)
从sort
edvector
的任意一端移除20%的观察值大约是移除的第一个和最后一个观察值
mean(v2[-c(1, 7)])
#[1] 22.6
这等于
mean(v1, trim = 0.2)
#[1] 22.6
-使用trim=0.4检查
mean(v2[-c(1:2, 6:7)])
#[1] 22.33333
mean(v1, trim = 0.4)
#[1] 22.33333
您显示的代码看起来像来自Datacamp的Intermediate R的一个示例。不幸的是,该类没有进一步解释修剪的含义以及您实际应该使用它的时间。我还发现自己对为什么要使用它感到非常困惑。以下是我的发现:
首先,修剪平均值是中心趋势的稳健估计值。它的计算非常简单,因为你只需1)在分布的每一侧移除预定数量的观测值,然后2)平均剩余的观测值。
这样,通过消除不对称分布两侧的一些观测值,大部分观测值的修剪平均值估计效果更好,其标准误差受离群值的影响更小(与“传统”平均值相比)
让我们看看您提供的Datacamp示例:
linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)
您显示的代码看起来像来自Datacamp的Intermediate R的示例。不幸的是,这个类没有进一步解释修剪的意思是什么,也没有解释你应该何时实际使用它。我也发现自己对我们为什么要使用它感到很困惑。以下是我的发现:
首先,修剪均值是中心趋势的稳健估计。它的计算非常简单,因为你只需要1)在分布的每一侧移除预定数量的观测值,然后2)平均剩余的观测值。
这样,通过消除不对称分布两侧的一些观测值,大部分观测值的修剪平均值估计效果更好,其标准误差受离群值的影响更小(与“传统”平均值相比)
让我们看看您提供的Datacamp示例:
linkedin <- c(16, 9, 13, 5, 2, 17, 14)
facebook <- c(17, 7, 5, 16, 8, 13, 14)
如果您选中“平均值”
修剪-在计算平均值之前,从x的每一端修剪的观察值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点。
我仍在努力理解。因此,它会删除距离平均值(x)最远的20%的值?或者类似的东西,如果你检查?mean
trim-在计算平均值之前,从x的每一端修剪观察值的分数(0到0.5)。超出该范围的修剪值被视为最近的端点。
我仍在努力理解。因此,它会删除距离平均值(x)最远的20%的值?或者类似的