Machine learning 随机森林回归中的树数

Machine learning 随机森林回归中的树数,machine-learning,random-forest,Machine Learning,Random Forest,我正在学习随机森林回归模型。我知道它形成了许多树(模型),然后我们可以通过平均所有树的结果来预测我们的目标变量。我对决策树回归算法也有一定的理解。我们如何才能形成最佳数量的树木 例如,我有一个数据集,其中我预测的是个人工资,我只有两个输入变量,即“经验年数”、“绩效分数”,那么我可以使用这些数据集形成多少随机树?随机森林树是否依赖于输入变量的数量?任何好榜样都将受到高度赞赏 提前感谢决策树在整个数据集上训练模型,并且只创建一个模型。在随机森林中,通过限制行数和特征,创建多个决策树,并根据数据子集

我正在学习随机森林回归模型。我知道它形成了许多树(模型),然后我们可以通过平均所有树的结果来预测我们的目标变量。我对决策树回归算法也有一定的理解。我们如何才能形成最佳数量的树木

例如,我有一个数据集,其中我预测的是个人工资,我只有两个输入变量,即“经验年数”、“绩效分数”,那么我可以使用这些数据集形成多少随机树?随机森林树是否依赖于输入变量的数量?任何好榜样都将受到高度赞赏


提前感谢

决策树在整个数据集上训练模型,并且只创建一个模型。在随机森林中,通过限制行数和特征,创建多个决策树,并根据数据子集对每个决策树进行训练。在您的情况下,您只有两个功能,因此模型将在数据子集上创建和训练数据

您可以为数据创建任意数量的随机树。通常在随机林中,树越多,性能越好,但计算时间也越长。对数据进行实验,查看不同数量的树之间的性能变化。如果性能保持不变,则使用较少的树来加快计算速度。您可以使用网格搜索进行此操作


此外,您还可以使用其他ml模型(如线性回归)进行试验,该模型在您的案例中表现良好。

决策树在整个数据集上训练模型,并且只创建一个模型。在随机森林中,通过限制行数和特征,创建多个决策树,并根据数据子集对每个决策树进行训练。在您的情况下,您只有两个功能,因此模型将在数据子集上创建和训练数据

您可以为数据创建任意数量的随机树。通常在随机林中,树越多,性能越好,但计算时间也越长。对数据进行实验,查看不同数量的树之间的性能变化。如果性能保持不变,则使用较少的树来加快计算速度。您可以使用网格搜索进行此操作


您还可以尝试其他ml模型,如线性回归,它在您的案例中可能表现良好。

为什么将其标记为“深度学习”?这个问题与
深度学习无关
-请不要滥发不相关的标记(删除并替换为
随机林
),为什么将其标记为“深度学习”?问题与深入学习无关
-请不要发送不相关的标签(删除并替换为
随机林
)@user9165263您的经验和判断告诉您在随机林中过度适应太多树木的可能性是什么?@user9165263您的经验和判断告诉您在随机林中过度适应太多树木的可能性是什么?