R 如何使用类标签在给定的训练和测试数据中执行最小二乘回归？_R_Data Mining_Linear Regression_Least Squares

R 如何使用类标签在给定的训练和测试数据中执行最小二乘回归？

R 如何使用类标签在给定的训练和测试数据中执行最小二乘回归？,r,data-mining,linear-regression,least-squares,R,Data Mining,Linear Regression,Least Squares,我有一套63*62的培训教材，还有班级标签。测试数据为25*62尺寸，并带有类别标签。鉴于此，我将如何执行最小二乘回归？我正在使用代码： res=lm（身高~年龄）身高和年龄对应什么？当我有61个功能+1个类（训练数据为62列）时，我将如何输入参数另外，如何将模型应用于测试数据？高度和年龄只是数据框中列的标签高度是一个预测变量。您可以在那里拥有任意多的变量：res=lm（身高~年龄+身高+性别）然而，我必须说，这个问题对我来说似乎有点奇怪，因为如果你用62个变量进行回归，在训练集中有62个

我有一套63*62的培训教材，还有班级标签。测试数据为25*62尺寸，并带有类别标签。鉴于此，我将如何执行最小二乘回归？我正在使用代码：

res=lm（身高~年龄）

身高和年龄对应什么？当我有61个功能+1个类（训练数据为62列）时，我将如何输入参数

另外，如何将模型应用于测试数据？

高度

和

年龄

只是数据框中列的标签<代码>高度是一个预测变量。您可以在那里拥有任意多的变量：

res=lm（身高~年龄+身高+性别）

然而，我必须说，这个问题对我来说似乎有点奇怪，因为如果你用62个变量进行回归，在训练集中有62个点，这就意味着你总是有一个精确的解。训练集应始终（显著）大于所使用的变量数。

如果有62列，则可能需要使用更一般的公式

res = lm(height ~ . , data = mydata)

请注意句点“.”如何表示其余变量。但是前面的答案是完全正确的，因为变量比观察值多，因此答案（如果有不应该的答案）是完全无用的。

谢谢你的回答！！现在我有了最合适的使用：abline（res）。我将如何在测试数据上使用这个模型？我不知道你的意思。abline（res）应绘制一条最佳拟合线。据我所知，这只适用于二维。如果你想减去系数并乘以测试数据，你可能想使用coefs，很抱歉，但我想问的是，使用训练数据生成的模型是否可以用在测试数据中？嗯，我想你可能在寻找函数predict。在这种情况下，您可以输入类似于库（utils）predict（res，newdata=yourdata[64:XX，]）的内容。您可以发布

head（training.data）

？