Machine learning 机器学习:如何避免小数据集的过度拟合?

Machine learning 机器学习:如何避免小数据集的过度拟合?,machine-learning,cluster-analysis,Machine Learning,Cluster Analysis,如果我们想在一个具有许多属性的小数据集上应用机器学习作业,可能很容易克服拟合问题。 如何避免这种情况?最简单的答案是使用过度拟合的抵抗方法,如随机森林法或以树桩为弱学习者的助推法。获取更多数据。说真的,如果你只有很少的数据,然后对其应用一些复杂的模型,那是行不通的。谢谢你的建议,而我只能得到一小部分数据。无论如何可能更适合或,但我相信在这两个网站上,在我同意交叉验证和数据科学是解决这个问题的更好论坛之前,有人问了一个类似的问题,但你可以研究正则化,它为你的目标函数添加了一个术语,惩罚复杂的曲线拟

如果我们想在一个具有许多属性的小数据集上应用机器学习作业,可能很容易克服拟合问题。
如何避免这种情况?

最简单的答案是使用过度拟合的抵抗方法,如随机森林法或以树桩为弱学习者的助推法。

获取更多数据。说真的,如果你只有很少的数据,然后对其应用一些复杂的模型,那是行不通的。谢谢你的建议,而我只能得到一小部分数据。无论如何可能更适合或,但我相信在这两个网站上,在我同意交叉验证和数据科学是解决这个问题的更好论坛之前,有人问了一个类似的问题,但你可以研究正则化,它为你的目标函数添加了一个术语,惩罚复杂的曲线拟合解。你的问题太宽泛了。一个人可以做许多既定的事情来防止过度装配。如果你的训练因为没有足够的数据而过早停止,那么这是一个完全不同的问题,即你没有足够的数据。