R 改变最佳拟合线的计算方法

R 改变最佳拟合线的计算方法,r,linear-regression,lm,absolute-value,R,Linear Regression,Lm,Absolute Value,在使用R的lm()函数来计算数据的最佳拟合行时,我遇到了一个问题:我的数据集中有一两个主要的异常值迫使该行出现在无法帮助我理解数据的地方 我的目标是改变lm()用于计算残差平方和到残差绝对值之和的方法 有人知道如何做到这一点吗?我将提出另一种方法,稳健的线性模型;它们不使用绝对偏差的平均值(或总和),而是降低异常值的影响MASS::rlm与lm基本上具有相同的语法:这里我将在ggplot上下文中对其进行说明 您还可以使用robustbase::lmrob()来实现相同方法的不同实现,或者(如G.

在使用R的
lm()
函数来计算数据的最佳拟合行时,我遇到了一个问题:我的数据集中有一两个主要的异常值迫使该行出现在无法帮助我理解数据的地方

我的目标是改变
lm()
用于计算残差平方和到残差绝对值之和的方法


有人知道如何做到这一点吗?

我将提出另一种方法,稳健的线性模型;它们不使用绝对偏差的平均值(或总和),而是降低异常值的影响
MASS::rlm
lm
基本上具有相同的语法:这里我将在
ggplot
上下文中对其进行说明

您还可以使用
robustbase::lmrob()
来实现相同方法的不同实现,或者(如G.Grothendieck所建议的)
quantreg::rq()
来拟合中位数的直线模型(这基本上符合您最初要求的,即疯狂回归)

库(MASS)
种子集(101)
##生成相关数据(正斜率)

dd查看quantreg软件包和Robust CRAN任务视图如果您提供数据集和分析的可复制代码,则解决问题会更容易。我认为这里的一般做法是删除异常值,因为它严重影响线性模型的泛化。