Machine learning 为什么主成分的方向是最大方差?

Machine learning 为什么主成分的方向是最大方差?,machine-learning,statistics,Machine Learning,Statistics,主成分分析中的变异数据指的是什么?我的意思是假设我们有5个特征,或者我们可以说5个维度,那么数据的变化会是什么?意思是说,它是否指每个特征中数据的变化?以及为什么PCA是数据变化最大的方向?交叉验证的答案为您的问题提供了极好的答案 最重要的是,为了回答为什么主成分分析会朝着数据最大变化的方向发展?我建议阅读一些信息论的基础知识,对这个主题做一个很好的介绍。举一个具体的例子,想象一下,在你的5个特征中,有一个向量是全1。这是直觉,它没有帮助你;所有样本都具有相同的特征。这一特性的方差为零——它不包

主成分分析中的变异数据指的是什么?我的意思是假设我们有5个特征,或者我们可以说5个维度,那么数据的变化会是什么?意思是说,它是否指每个特征中数据的变化?以及为什么PCA是数据变化最大的方向?

交叉验证的答案为您的问题提供了极好的答案

最重要的是,为了回答为什么主成分分析会朝着数据最大变化的方向发展?我建议阅读一些信息论的基础知识,对这个主题做一个很好的介绍。举一个具体的例子,想象一下,在你的5个特征中,有一个向量是全1。这是直觉,它没有帮助你;所有样本都具有相同的特征。这一特性的方差为零——它不包含任何信息。零熵,一个完美的顺序,如果你愿意的话,意味着在给定的方向上没有任何变化:从数据中删除一个明确的候选者。增加差异=增加信息内容