预测r中缺失数据的值

预测r中缺失数据的值,r,R,我正在处理一个总共有1008个观测值的数据集,并删除缺失的案例以创建线性模型。该训练集目前共有937次观察 我用于创建lm的代码如下所示: lm.data <- lm(N001S009P088.Average.Horizontal.Wind.Speed.RG.6 ~ C01.Average.Wind.Speed.48.5m+ C02.Average.Wind.Speed.48.5m+ C03.Average.Wind.Speed.40.0m+

我正在处理一个总共有1008个观测值的数据集,并删除缺失的案例以创建线性模型。该训练集目前共有937次观察

我用于创建lm的代码如下所示:

lm.data <- lm(N001S009P088.Average.Horizontal.Wind.Speed.RG.6 ~ C01.Average.Wind.Speed.48.5m+
            C02.Average.Wind.Speed.48.5m+ C03.Average.Wind.Speed.40.0m+
            C05.Average.Wind.Speed.15.0m+ N002S007P004.Average.Pressure..mb.+ 
            N001S007P006.Average.wind.speed,
          data=complete.data)
现在,我尝试返回并使用训练集中的lm预测原始数据集中缺少的值

all.data$Expected.RG.6.Average.Wind.Speed <- predict(lm.data)
当我运行此进程时,会收到以下错误消息:


美元中的错误也许这个链接有助于输入预测结果,但没有说明这项工作可能被用于的最终用途似乎在统计学上是可疑的。如果你现在打算对这个autmented进行某种验证性分析,有些人可能会说是扭曲或伪造的数据集,那么我们只能祝你好运;它使用五大湖的风力测量。该项目的最终目的是找到预测值,并将其与实际值进行对比。在没有可复制的示例的情况下,我想您应该使用predict的newdata参数。您正在尝试预测所有947个值,并将其添加到整个1008数据集。使用newdata仅传入缺少值的行。使用相同的筛选器将原始complete.data子集以插入结果。