Machine learning 为什么网络模型平均值可以提高测试集的性能?

Machine learning 为什么网络模型平均值可以提高测试集的性能?,machine-learning,neural-network,deep-learning,Machine Learning,Neural Network,Deep Learning,随着人们训练一些网络模型,然后进行模型平均,以提高最终网络的性能。然后我想知道为什么模型平均可以工作?有没有关于这方面的文件或解释 事实上,辍学也是模型平均值,那么为什么辍学能起作用呢?人们采用模型平均值,这样,如果任何模型与数据拟合过度,组合的模型平均值将能够提供更一般的预测。我投票将这个问题作为离题来结束,因为这不是一个编程问题。这是一个巨大的话题,而且它并不局限于神经网络(即,它通常适用于ML);从谷歌搜索“模特组合”开始,从维基百科上的条目开始。。。

随着人们训练一些网络模型,然后进行模型平均,以提高最终网络的性能。然后我想知道为什么模型平均可以工作?有没有关于这方面的文件或解释


事实上,辍学也是模型平均值,那么为什么辍学能起作用呢?

人们采用模型平均值,这样,如果任何模型与数据拟合过度,组合的模型平均值将能够提供更一般的预测。

我投票将这个问题作为离题来结束,因为这不是一个编程问题。这是一个巨大的话题,而且它并不局限于神经网络(即,它通常适用于ML);从谷歌搜索“模特组合”开始,从维基百科上的条目开始。。。