R 为什么我的线性回归拟合线看起来是错误的?

R 为什么我的线性回归拟合线看起来是错误的?,r,scatter-plot,linear-regression,best-fit,R,Scatter Plot,Linear Regression,Best Fit,我已经绘制了一个二维柱状图,我可以用线、点等添加到图中。 现在我试图在密集点区域应用线性回归拟合,但是我的线性回归线似乎完全偏离了它应该在的位置? 这里展示的是我左边的曲线图,包括lowess回归拟合和线性拟合 lines(lowess(na.omit(a),na.omit(b),iter=10),col='gray',lwd=3) abline(lm(b[cc]~a[cc]),lwd=3) 这里a和b是我的值,cc是最密集部分内的点(即大多数点位于那里),红色+黄色+蓝色 为什么我的回归

我已经绘制了一个二维柱状图,我可以用线、点等添加到图中。 现在我试图在密集点区域应用线性回归拟合,但是我的线性回归线似乎完全偏离了它应该在的位置? 这里展示的是我左边的曲线图,包括lowess回归拟合和线性拟合

lines(lowess(na.omit(a),na.omit(b),iter=10),col='gray',lwd=3)

abline(lm(b[cc]~a[cc]),lwd=3)
这里a和b是我的值,cc是最密集部分内的点(即大多数点位于那里),红色+黄色+蓝色

为什么我的回归线看起来不像右边的(手绘拟合)? 如果我在画一条最合适的线,它会在那里吗

我有许多类似的情节,但我仍然得到相同的结果


有没有其他的线性回归适合我的方法

线性回归是一种将线性函数拟合到一组点(观测值)的方法,可最小化最小二乘误差

现在想象一下,你的热图显示了一个形状,你会假设一条垂直线最适合你。只需将你的热图逆时针旋转10度,就可以了

那么,应该如何定义一个垂直的线性函数呢?确切地说,这是不可能的


这个小小的思维实验的结果是,你混淆了线性回归的目的,而你最可能想要的是——正如加文·辛普森所指出的那样。

右侧图上的粗线看起来像是数据点的第一个主成分。很好地说明了你的想法。很可能会在教学中使用。。。我感兴趣的是:通常我会说这个问题应该是交叉验证的,但同时我怀疑你会这么快得到这么好的答案。你介意分享一个可复制的例子吗?很好的答案。对于娱乐,@PhillipPhillipson,您可以尝试加权最小二乘法,其权重由用于生成热图的局部密度函数确定。这是另一种基于外部知识“调整”数据的方法——我一点也不认为它比PCA更好。我甚至不知道存在这样的回归模型!PCA做得更好。