R 如何使用类标签在给定的训练和测试数据中执行最小二乘回归?

R 如何使用类标签在给定的训练和测试数据中执行最小二乘回归?,r,data-mining,linear-regression,least-squares,R,Data Mining,Linear Regression,Least Squares,我有一套63*62的培训教材,还有班级标签。测试数据为25*62尺寸,并带有类别标签。鉴于此,我将如何执行最小二乘回归?我正在使用代码: res=lm(身高~年龄) 身高和年龄对应什么?当我有61个功能+1个类(训练数据为62列)时,我将如何输入参数 另外,如何将模型应用于测试数据?高度和年龄只是数据框中列的标签高度是一个预测变量。您可以在那里拥有任意多的变量:res=lm(身高~年龄+身高+性别) 然而,我必须说,这个问题对我来说似乎有点奇怪,因为如果你用62个变量进行回归,在训练集中有62个

我有一套63*62的培训教材,还有班级标签。测试数据为25*62尺寸,并带有类别标签。鉴于此,我将如何执行最小二乘回归?我正在使用代码:

res=lm(身高~年龄)

身高和年龄对应什么?当我有61个功能+1个类(训练数据为62列)时,我将如何输入参数


另外,如何将模型应用于测试数据?

高度
年龄
只是数据框中列的标签<代码>高度是一个预测变量。您可以在那里拥有任意多的变量:
res=lm(身高~年龄+身高+性别)


然而,我必须说,这个问题对我来说似乎有点奇怪,因为如果你用62个变量进行回归,在训练集中有62个点,这就意味着你总是有一个精确的解。训练集应始终(显著)大于所使用的变量数。

如果有62列,则可能需要使用更一般的公式

res = lm(height ~ . , data = mydata)

请注意句点“.”如何表示其余变量。但是前面的答案是完全正确的,因为变量比观察值多,因此答案(如果有不应该的答案)是完全无用的。

谢谢你的回答!!现在我有了最合适的使用:abline(res)。我将如何在测试数据上使用这个模型?我不知道你的意思。abline(res)应绘制一条最佳拟合线。据我所知,这只适用于二维。如果你想减去系数并乘以测试数据,你可能想使用coefs,很抱歉,但我想问的是,使用训练数据生成的模型是否可以用在测试数据中?嗯,我想你可能在寻找函数predict。在这种情况下,您可以输入类似于库(utils)predict(res,newdata=yourdata[64:XX,])的内容。您可以发布
head(training.data)