Machine learning 机器学习：如何避免小数据集的过度拟合？_Machine Learning_Cluster Analysis

Machine learning 机器学习：如何避免小数据集的过度拟合？

machine-learning

Machine learning 机器学习：如何避免小数据集的过度拟合？,machine-learning,cluster-analysis,Machine Learning,Cluster Analysis,如果我们想在一个具有许多属性的小数据集上应用机器学习作业，可能很容易克服拟合问题。如何避免这种情况？最简单的答案是使用过度拟合的抵抗方法，如随机森林法或以树桩为弱学习者的助推法。获取更多数据。说真的，如果你只有很少的数据，然后对其应用一些复杂的模型，那是行不通的。谢谢你的建议，而我只能得到一小部分数据。无论如何可能更适合或，但我相信在这两个网站上，在我同意交叉验证和数据科学是解决这个问题的更好论坛之前，有人问了一个类似的问题，但你可以研究正则化，它为你的目标函数添加了一个术语，惩罚复杂的曲线拟

如果我们想在一个具有许多属性的小数据集上应用机器学习作业，可能很容易克服拟合问题。

如何避免这种情况？

最简单的答案是使用过度拟合的抵抗方法，如随机森林法或以树桩为弱学习者的助推法。

获取更多数据。说真的，如果你只有很少的数据，然后对其应用一些复杂的模型，那是行不通的。谢谢你的建议，而我只能得到一小部分数据。无论如何可能更适合或，但我相信在这两个网站上，在我同意交叉验证和数据科学是解决这个问题的更好论坛之前，有人问了一个类似的问题，但你可以研究正则化，它为你的目标函数添加了一个术语，惩罚复杂的曲线拟合解。你的问题太宽泛了。一个人可以做许多既定的事情来防止过度装配。如果你的训练因为没有足够的数据而过早停止，那么这是一个完全不同的问题，即你没有足够的数据。