Machine learning 更多的训练数据减少了差异_Machine Learning_Artificial Intelligence_Classification

Machine learning 更多的训练数据减少了差异

machine-learning artificial-intelligence

Machine learning 更多的训练数据减少了差异,machine-learning,artificial-intelligence,classification,Machine Learning,Artificial Intelligence,Classification,据我理解，高方差意味着模型本身存在过度拟合的问题。但在安德鲁·吴的视频讲座中，他提到了这一点。具体原因是什么？基本上，如果模型相对于训练集大小的差异过大，模型将过度拟合如果你有5个自由度，你可以完全匹配5个样品。但你不能完全匹配1000个样本因此，通过添加更多的数据样本（从而有望增加数据集中的方差），可以防止过度拟合不幸的是，很难获得更多的数据。减少自由度更容易。1-更多的训练数据大小会导致SNR（信噪比）增加 2-增加信噪比意味着噪声降低。 3-当噪声降低时，模型的方差将减小。请注意噪

据我理解，高方差意味着模型本身存在过度拟合的问题。但在安德鲁·吴的视频讲座中，他提到了这一点。具体原因是什么？

基本上，如果模型相对于训练集大小的差异过大，模型将过度拟合

如果你有5个自由度，你可以完全匹配5个样品。但你不能完全匹配1000个样本

因此，通过添加更多的数据样本（从而有望增加数据集中的方差），可以防止过度拟合

不幸的是，很难获得更多的数据。减少自由度更容易。

1-更多的训练数据大小会导致SNR（信噪比）增加 2-增加信噪比意味着噪声降低。 3-当噪声降低时，模型的方差将减小。

请注意噪声导致的差异（干净的数据不会导致模型中的差异）

什么是“高差异”？如果你试图尽可能精确地表述你的问题，那么你很可能能够自己回答。即使没有，别人也会更容易帮助你。偏见和差异是ML（）的艺术术语。但该评论强调，就目前而言，这可能并不完全是一个话题。