R-减少使用插入符号训练随机林的内存使用

R-减少使用插入符号训练随机林的内存使用,r,r-caret,R,R Caret,我正在尝试创建一个随机林,提供大约10万个输入。为了完成这些任务,我使用插入符号包中的train和method=“parRF”。不幸的是,我的机器有128 GB的内存,但仍然用完了。因此,我需要减少我使用的内存量 现在,我正在运行的训练方法是: > trControl <- trainControl(method = "LGOCV", p = 0.9, savePredictions = T) > model_parrf <- train(x = data_preds,

我正在尝试创建一个随机林,提供大约10万个输入。为了完成这些任务,我使用插入符号包中的
train
method=“parRF”
。不幸的是,我的机器有128 GB的内存,但仍然用完了。因此,我需要减少我使用的内存量

现在,我正在运行的训练方法是:

> trControl <- trainControl(method = "LGOCV", p = 0.9, savePredictions = T)
> model_parrf <- train(x = data_preds, y = data_resp, method = "parRF",
                     trControl = trControl)
此外,此警告被反复抛出:

In eval(expr, envir, enclos) :
  predictions failed for Resample01: mtry=2 Error in predict.randomForest(modelFit, newdata) : 
  No forest component in the object

似乎出于某种原因,插入符号要求保留森林以便比较模型。有什么方法可以使用内存较少的插入符号吗?

请记住,如果使用
M
内核,则需要将数据集
M+1
存储几次。尝试使用更少的工人。

数据相对较小。每行有9个双精度和一个因子,因此我希望预测器的数据帧和响应向量一起小于10 MB。使用多个核心是否也会增加保留的树木数量?如果您使用不同的内核来训练具有不同调优参数的模型,似乎会出现这种情况,但如果您跨多个内核训练单个林,则不会有显著的变化。
In eval(expr, envir, enclos) :
  predictions failed for Resample01: mtry=2 Error in predict.randomForest(modelFit, newdata) : 
  No forest component in the object