Statistics 多解释变量预测模型的建立

Statistics 多解释变量预测模型的建立,statistics,regression,Statistics,Regression,现在我想用几个解释变量做一些预测 我想问你我的方法是否错了 我有一个分数(这里是Y)和4个特征(X1、X2、X3和X4),有100个观察值 现在,我使用皮尔逊相关系数和线性回归(β)分别研究了Y和X1、X2、X3和X4之间的关系 利用这个关系,我通过加权和做了一些Y的预测 我建立了逐步线性回归模型并使用了权重(它显示了增加的相关系数和β) 由于我缺乏知识,我想知道这是否是有效的方法,并得到一些提示(当X的单位不同时,其他方法) 多谢各位 KHW 谢谢你的建议 事实上,我知道测量值X可能在Y之间

现在我想用几个解释变量做一些预测

我想问你我的方法是否错了

我有一个分数(这里是Y)和4个特征(X1、X2、X3和X4),有100个观察值

现在,我使用皮尔逊相关系数和线性回归(β)分别研究了Y和X1、X2、X3和X4之间的关系

利用这个关系,我通过加权和做了一些Y的预测

我建立了逐步线性回归模型并使用了权重(它显示了增加的相关系数和β)

由于我缺乏知识,我想知道这是否是有效的方法,并得到一些提示(当X的单位不同时,其他方法)

多谢各位

KHW


谢谢你的建议

事实上,我知道测量值X可能在Y之间存在线性关系。我的方法是分别研究X1、X2、X3和X4的皮尔逊相关系数和回归β。我发现了这些特性和Y之间的线性关系,但我想通过组合这些特性来提高可预测性(这里是r和beta)。因此我把Y'=B(0)+B(1)*X1+B(2)*X2+…+B(4)*X4,其中Y'是估计的Y,B(0)是截距

首先,我用逐步线性回归法得到Y'=B(0)+B(1)*X1+B(4)*X4

第二,我把Y'=B(0)+B(1)*X1+B(2)*X2+…+B(4)*X4采用多元线性回归

它们拟合得很好,但我担心我实际上想说的是特征可以预测Y,但是使用回归选择系数需要Y,这意味着它不是一个预测因子

k-折叠交叉验证是否可以作为一种验证方法


谢谢

我建议目视检查Y与X1、Y与X2等的散点图,以确保关系是线性的,或者如果在图上可以看到其他明显类型的关系。这有助于确保您没有错过一些明显的非线性关系,例如指数。谢谢您的建议!现在我想再问几个问题,但是评论区不允许我写得更长,所以我编辑了这篇文章。如果你能给我更多的意见,我将不胜感激。你是对的,X1,X2,X3,X4在回归建立的数学模型中被用来预测Y。该模型的一个度量是问,“Y中的方差有多少是由该模型解释的?”我通过计算R平方(R2)作为“R2=1.0-(绝对误差方差/Y方差)”来实现这一点。如果R2值为0,50,您的模型将解释Y中50%的方差。如果R2值为0.99,则您的模型将解释Y中99%的方差。拟合优度有许多统计度量,并且R平方在回归分析中使用非常广泛。我感谢您的评论。我将首先计算R平方,然后搜索其他的。非常感谢。