R 重要预测变量的随机森林_R_Random Forest

R 重要预测变量的随机森林

R 重要预测变量的随机森林,r,random-forest,R,Random Forest,在我的数据集中，我有19个预测变量，包括分类变量和连续变量。我想只使用重要的预测变量（不是所有的预测变量）来拟合一个随机森林模型，并且我必须重复这个过程100次。如何使用R来实现这一点？有什么建议吗？如果您正在使用Boruta软件包进行功能选择，请查看此处提供的示例脚本：。在第32行，他们使用Boruta包执行特征选择。在第35行，他们得到了那些没有被拒绝的功能。在第38行，他们在这一特征子集上训练一个随机林。你所说的“重要预测变量”是什么意思？你想用哪个软件包：有很多不同的软件包以某种形式实现

在我的数据集中，我有19个预测变量，包括分类变量和连续变量。我想只使用重要的预测变量（不是所有的预测变量）来拟合一个随机森林模型，并且我必须重复这个过程100次。如何使用R来实现这一点？有什么建议吗？

如果您正在使用Boruta软件包进行功能选择，请查看此处提供的示例脚本：。在第32行，他们使用Boruta包执行特征选择。在第35行，他们得到了那些没有被拒绝的功能。在第38行，他们在这一特征子集上训练一个随机林。

你所说的“重要预测变量”是什么意思？你想用哪个软件包：有很多不同的软件包以某种形式实现随机林。这意味着我想找到最好的模型（比如回归），它不包括所有的19个变量。我已经用“Boruta”软件包试过了。虽然我找到了重要的变量，但我无法通过使用选定的变量来拟合随机森林模型，因为它只给出了重要变量的列表。