R-减少使用插入符号训练随机林的内存使用_R_R Caret

R-减少使用插入符号训练随机林的内存使用

R-减少使用插入符号训练随机林的内存使用,r,r-caret,R,R Caret,我正在尝试创建一个随机林，提供大约10万个输入。为了完成这些任务，我使用插入符号包中的train和method=“parRF”。不幸的是，我的机器有128 GB的内存，但仍然用完了。因此，我需要减少我使用的内存量现在，我正在运行的训练方法是： > trControl <- trainControl(method = "LGOCV", p = 0.9, savePredictions = T) > model_parrf <- train(x = data_preds,

我正在尝试创建一个随机林，提供大约10万个输入。为了完成这些任务，我使用插入符号包中的

train

和

method=“parRF”

。不幸的是，我的机器有128 GB的内存，但仍然用完了。因此，我需要减少我使用的内存量

现在，我正在运行的训练方法是：

> trControl <- trainControl(method = "LGOCV", p = 0.9, savePredictions = T)
> model_parrf <- train(x = data_preds, y = data_resp, method = "parRF",
                     trControl = trControl)

此外，此警告被反复抛出：

In eval(expr, envir, enclos) :
  predictions failed for Resample01: mtry=2 Error in predict.randomForest(modelFit, newdata) : 
  No forest component in the object

似乎出于某种原因，插入符号要求保留森林以便比较模型。有什么方法可以使用内存较少的插入符号吗？

请记住，如果使用

内核，则需要将数据集

M+1

存储几次。尝试使用更少的工人。

数据相对较小。每行有9个双精度和一个因子，因此我希望预测器的数据帧和响应向量一起小于10 MB。使用多个核心是否也会增加保留的树木数量？如果您使用不同的内核来训练具有不同调优参数的模型，似乎会出现这种情况，但如果您跨多个内核训练单个林，则不会有显著的变化。

In eval(expr, envir, enclos) :
  predictions failed for Resample01: mtry=2 Error in predict.randomForest(modelFit, newdata) : 
  No forest component in the object