Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/283.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 更多的训练数据减少了差异_Machine Learning_Artificial Intelligence_Classification - Fatal编程技术网

Machine learning 更多的训练数据减少了差异

Machine learning 更多的训练数据减少了差异,machine-learning,artificial-intelligence,classification,Machine Learning,Artificial Intelligence,Classification,据我理解,高方差意味着模型本身存在过度拟合的问题。但在安德鲁·吴的视频讲座中,他提到了这一点。具体原因是什么?基本上,如果模型相对于训练集大小的差异过大,模型将过度拟合 如果你有5个自由度,你可以完全匹配5个样品。但你不能完全匹配1000个样本 因此,通过添加更多的数据样本(从而有望增加数据集中的方差),可以防止过度拟合 不幸的是,很难获得更多的数据。减少自由度更容易。1-更多的训练数据大小会导致SNR(信噪比)增加 2-增加信噪比意味着噪声降低。 3-当噪声降低时,模型的方差将减小。 请注意噪

据我理解,高方差意味着模型本身存在过度拟合的问题。但在安德鲁·吴的视频讲座中,他提到了这一点。具体原因是什么?

基本上,如果模型相对于训练集大小的差异过大,模型将过度拟合

如果你有5个自由度,你可以完全匹配5个样品。但你不能完全匹配1000个样本

因此,通过添加更多的数据样本(从而有望增加数据集中的方差),可以防止过度拟合


不幸的是,很难获得更多的数据。减少自由度更容易。

1-更多的训练数据大小会导致SNR(信噪比)增加 2-增加信噪比意味着噪声降低。 3-当噪声降低时,模型的方差将减小。
请注意噪声导致的差异(干净的数据不会导致模型中的差异)

什么是“高差异”?如果你试图尽可能精确地表述你的问题,那么你很可能能够自己回答。即使没有,别人也会更容易帮助你。偏见和差异是ML()的艺术术语。但该评论强调,就目前而言,这可能并不完全是一个话题。