Machine learning 为什么需要从随机森林中的数据中随机选择样本?

Machine learning 为什么需要从随机森林中的数据中随机选择样本?,machine-learning,random-forest,Machine Learning,Random Forest,我们也可以通过随机选择特征而不创建太多样本,从同一数据中形成不同的决策树。选择数据的随机子集是一种确保每个树不会过度拟合基础数据的方法。你说的“创建这么多样本”是什么意思?在RF中没有创建样本实际上,在RF中,我们同时创建两个样本(即随机选择两个数据和特征);这里的答案可能有用:

我们也可以通过随机选择特征而不创建太多样本,从同一数据中形成不同的决策树。

选择数据的随机子集是一种确保每个树不会过度拟合基础数据的方法。

你说的“创建这么多样本”是什么意思?在RF中没有创建样本实际上,在RF中,我们同时创建两个样本(即随机选择两个数据和特征);这里的答案可能有用: