R 重要预测变量的随机森林

R 重要预测变量的随机森林,r,random-forest,R,Random Forest,在我的数据集中,我有19个预测变量,包括分类变量和连续变量。我想只使用重要的预测变量(不是所有的预测变量)来拟合一个随机森林模型,并且我必须重复这个过程100次。如何使用R来实现这一点?有什么建议吗?如果您正在使用Boruta软件包进行功能选择,请查看此处提供的示例脚本:。在第32行,他们使用Boruta包执行特征选择。在第35行,他们得到了那些没有被拒绝的功能。在第38行,他们在这一特征子集上训练一个随机林。你所说的“重要预测变量”是什么意思?你想用哪个软件包:有很多不同的软件包以某种形式实现

在我的数据集中,我有19个预测变量,包括分类变量和连续变量。我想只使用重要的预测变量(不是所有的预测变量)来拟合一个随机森林模型,并且我必须重复这个过程100次。如何使用R来实现这一点?有什么建议吗?

如果您正在使用Boruta软件包进行功能选择,请查看此处提供的示例脚本:。在第32行,他们使用Boruta包执行特征选择。在第35行,他们得到了那些没有被拒绝的功能。在第38行,他们在这一特征子集上训练一个随机林。

你所说的“重要预测变量”是什么意思?你想用哪个软件包:有很多不同的软件包以某种形式实现随机林。这意味着我想找到最好的模型(比如回归),它不包括所有的19个变量。我已经用“Boruta”软件包试过了。虽然我找到了重要的变量,但我无法通过使用选定的变量来拟合随机森林模型,因为它只给出了重要变量的列表。