Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/75.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R XGBoost提取训练预测_R_Xgboost - Fatal编程技术网

R XGBoost提取训练预测

R XGBoost提取训练预测,r,xgboost,R,Xgboost,在非常嘈杂的数据集上生成模型时,我需要提取训练集上最终XGBoost模型所做的预测。我知道我可以从xgb.cv中提取出错误的预测,但是我不能用它来预测延迟测试集 我知道这不是一个常见的用例,但有必要在训练集中找出哪些样本代表异常值,以便进一步探索和稍后的模型叠加 有没有办法显示最终模型在训练集上做出的预测?我会想,既然我每轮都会出错,我可以,但我找不到办法。如果我误解了这个问题,请原谅,但是predict()不起作用吗 model = xgboost(data = data$train, nro

在非常嘈杂的数据集上生成模型时,我需要提取训练集上最终XGBoost模型所做的预测。我知道我可以从xgb.cv中提取出错误的预测,但是我不能用它来预测延迟测试集

我知道这不是一个常见的用例,但有必要在训练集中找出哪些样本代表异常值,以便进一步探索和稍后的模型叠加


有没有办法显示最终模型在训练集上做出的预测?我会想,既然我每轮都会出错,我可以,但我找不到办法。

如果我误解了这个问题,请原谅,但是
predict()
不起作用吗

model = xgboost(data = data$train, nround = 20,param=param)
training_predictions = predict(model, data$train)

另外,我在一台无法安装XGB的机器上,但我非常确定model对象具有作为元素之一的最终预测。

经过进一步思考,我想要的似乎是一个与Random Forest的出包预测类似的模型。然而,由于增强树的性质,没有真正的“真实”OOB样本,因为任何样本都可能出现在以前的树中


我认为最接近的方法是使用与训练模型相同的参数和随机种子从CV XGB模型中获取预测。

在训练集上运行predict可获得100%的准确率,与随机森林类似,因为树木在训练期间已看到所有数据。最终的模型对象也没有最终的预测(或者至少我一生都找不到),这很奇怪,因为它仍然可以计算训练集上的错误。