Machine learning 为什么主成分的方向是最大方差？_Machine Learning_Statistics

Machine learning 为什么主成分的方向是最大方差？

machine-learning statistics

Machine learning 为什么主成分的方向是最大方差？,machine-learning,statistics,Machine Learning,Statistics,主成分分析中的变异数据指的是什么？我的意思是假设我们有5个特征，或者我们可以说5个维度，那么数据的变化会是什么？意思是说，它是否指每个特征中数据的变化？以及为什么PCA是数据变化最大的方向？交叉验证的答案为您的问题提供了极好的答案最重要的是，为了回答为什么主成分分析会朝着数据最大变化的方向发展？我建议阅读一些信息论的基础知识，对这个主题做一个很好的介绍。举一个具体的例子，想象一下，在你的5个特征中，有一个向量是全1。这是直觉，它没有帮助你；所有样本都具有相同的特征。这一特性的方差为零——它不包

主成分分析中的变异数据指的是什么？我的意思是假设我们有5个特征，或者我们可以说5个维度，那么数据的变化会是什么？意思是说，它是否指每个特征中数据的变化？以及为什么PCA是数据变化最大的方向？

交叉验证的答案为您的问题提供了极好的答案

最重要的是，为了回答为什么主成分分析会朝着数据最大变化的方向发展？我建议阅读一些信息论的基础知识，对这个主题做一个很好的介绍。举一个具体的例子，想象一下，在你的5个特征中，有一个向量是全1。这是直觉，它没有帮助你；所有样本都具有相同的特征。这一特性的方差为零——它不包含任何信息。零熵，一个完美的顺序，如果你愿意的话，意味着在给定的方向上没有任何变化：从数据中删除一个明确的候选者。增加差异=增加信息内容