“什么是”的等价物;“最大深度”;在';R';一揽子计划;流浪者;?

“什么是”的等价物;“最大深度”;在';R';一揽子计划;流浪者;?,r,random-forest,R,Random Forest,其他随机林工具具有限制特定分支上最大拆分深度的“刻度盘” 例如,h2o.randomForest具有“最大深度” “ranger”的版本是什么?我不熟悉h2o.randomForest软件包,但我对随机森林的一般理解是,每棵树都会生长,直到树的每片叶子都有一定数量的最小数据点。换句话说,一棵树将继续分裂,直到每个数据点达到一定的分类级别。在标准的randomForest包中,有一个名为nodesize的参数,用于控制以下内容: ranger包中的类似参数似乎是min.node.size。您可以

其他随机林工具具有限制特定分支上最大拆分深度的“刻度盘”

例如,h2o.randomForest具有“最大深度”


“ranger”的版本是什么?

我不熟悉
h2o.randomForest
软件包,但我对随机森林的一般理解是,每棵树都会生长,直到树的每片叶子都有一定数量的最小数据点。换句话说,一棵树将继续分裂,直到每个数据点达到一定的分类级别。在标准的
randomForest
包中,有一个名为
nodesize
的参数,用于控制以下内容:


ranger
包中的类似参数似乎是
min.node.size
。您可以将上面链接中的信息与进行比较,以确信他们讨论的是同一件事。

最大深度是关于树桩和树叶之间的裂痕数。这是一个用于避免过度拟合的控制参数。@EngrStudent我不认为过度拟合是随机林的一个大问题。在任何情况下,节点的大小都可以让你对分割进行同样的控制。任何东西都可能会过度匹配。这不是最大的问题,但是如果您想要优化性能,那么您必须进行优化。如果你限制二叉树的拆分次数,那么你就在计算时间上设置了一个上限。我对随机林的理解是,它们相对不容易过度拟合,但也许我错了。在任何情况下,控制节点大小都应该给你相同的控件来控制分叉的数量。请考虑第24页: