Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/sorting/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 基于增广的新分层数据集预测提取_R_Dplyr_Broom - Fatal编程技术网

R 基于增广的新分层数据集预测提取

R 基于增广的新分层数据集预测提取,r,dplyr,broom,R,Dplyr,Broom,我正在按组/级别对数据进行回归。因此,每个级别都有一个reg,即,我的代码看起来非常类似于: library('dplyr') regressions <- mtcars %>% group_by(cyl) %>% do(mod = lm(mpg ~ wt, .)) library('dplyr') 回归% 组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组

我正在按组/级别对数据进行回归。因此,每个级别都有一个reg,即,我的代码看起来非常类似于:

library('dplyr')
regressions <- mtcars %>%
  group_by(cyl) %>%
  do(mod = lm(mpg ~ wt, .))
library('dplyr')
回归%
组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别组别
do(mod=lm(mpg~wt,))
如何在具有相同组的较小新数据集上提取预测?i、 e水平相同,但样本较小。我想在所有级别的新数据集上同时进行所有预测。我知道《扫帚》中的“增强”给了你预测。但我不知道如何一次完成所有级别的任务

我使用的代码如下所示

library('broom')
aa <- as.data.frame(augment(regressions, newdata=test))
库(“扫帚”)

aa是否希望
回归%>%augment(mod,newdata=test)
?是的,我尝试过,但它复制了我的数据,使其具有与原始数据集相同的维度,但所有重复数据的预测都不同。i、 e x(有重复的)预测10 5 10 15 10 9有没有一种方法可以指定它不会这样做?我只想要新数据的预测值。所以从技术上讲,我的结果的维度也应该是相同的。结果应该是测试数据集的大小乘以3,对吗?您有三个线性模型对象(
回归
),其中每个对象都用于对测试数据进行
预测.lm
。如果您只需要一个,
predict(lm(mpg~wt,mtcars),newdata=test)
应该可以工作。如果使用mtcars subset by cyl执行三次,应该会得到与使用augment and grouping by cyl相同的结果--它只会创建一些子集并在每一个子集上运行predict感谢您的帮助。我必须使用一个新的数据集进行近500次预测,我正在试图找到一种方法一次完成所有预测。上面的例子只是为了说明我需要做什么。我需要解决的问题是如何避免运行500次回归和预测。我知道如何按组进行回归,现在我希望能够按组进行预测。我的测试数据与我的训练数据集具有相同的级别。我也想知道如何做到这一点。我有n个主题,数据按两组水平分组,新数据也按两组水平分组,所有这些水平都可以有两个值。我的代码得到的答案大约是它们应该的四倍大(4=2x2)。我希望能够在模型和新数据之间进行等效的完全外部连接。
aa <- as.data.frame(augment(regressions, mod, newdata=test))