R 种子在随机森林里做什么?
我知道种子通常是被设定的,所以我们可以复制相同的结果。但是,设置种子在随机森林部分实际上做什么呢。它是否更改了R中的R 种子在随机森林里做什么?,r,machine-learning,random-forest,R,Machine Learning,Random Forest,我知道种子通常是被设定的,所以我们可以复制相同的结果。但是,设置种子在随机森林部分实际上做什么呢。它是否更改了R中的randomForest()函数的任何参数,如nTree或sampSize 我每次都在为随机森林模型使用不同的种子,但我想知道不同的种子如何影响随机森林模型。树木是从种子生长的,森林也是如此;-)(新加坡国家公园) 有不同的方法建立一个随机森林,但是,所有的共同点是,多棵树被建立。为了提高单个决策树的分类精度,随机林中的各个树需要不同,因为您将使用nTree乘以同一棵树。这种差异是
randomForest()
函数的任何参数,如nTree
或sampSize
我每次都在为随机森林模型使用不同的种子,但我想知道不同的种子如何影响随机森林模型。树木是从种子生长的,森林也是如此;-)(新加坡国家公园) 有不同的方法建立一个随机森林,但是,所有的共同点是,多棵树被建立。为了提高单个决策树的分类精度,随机林中的各个树需要不同,因为您将使用
nTree
乘以同一棵树。这种差异是通过在生成树时引入随机性来实现的。随机性受种子的影响,种子最重要的是,使用相同的种子应始终产生相同的结果
随机性如何影响树的构建?有多种方法。
-为随机子集构建树。这是针对森林中的每一棵树,绘制训练示例的子集,然后为该子集构建一棵树
-在树中的每个决策点,随机选择决策属性
通常这两个元素是结合在一起的
由于
randomForest
生成随机树,因此设置种子将保证相同的输出。正常使用时,对种子不做任何处理,默认情况下是随机的。不同的种子不会改变<代码> nTruts<代码>或<代码> SAMPsith,但它可以稍微改变模型的结果,当参数<>代码> nTruts被设置为低值时更显著。@ Axman考虑添加解释的答案。