Scikit learn 了解主成分分析(sklearn)的“成分”?
有人能给我解释一下PCA(sklearn)的变量Scikit learn 了解主成分分析(sklearn)的“成分”?,scikit-learn,pca,Scikit Learn,Pca,有人能给我解释一下PCA(sklearn)的变量成分吗。sklearn()的官方URL确实让我感到困惑 所以我有一个原始数据集,它有1000个特性,叫做df 我做到了: my_pca = PCA(n_components = 2) my_pca.fit_transform (df) my_pca.components_.shape # (2, 1000) 我能否将组件的每个元素解释为原始特征对每个PCA值的影响 感谢当您计算PCA时,您基本上计算(相关或协方差)矩阵的特征值和特征向量 所以实际
成分吗。sklearn()的官方URL确实让我感到困惑
所以我有一个原始数据集,它有1000个特性,叫做df
我做到了:
my_pca = PCA(n_components = 2)
my_pca.fit_transform (df)
my_pca.components_.shape # (2, 1000)
我能否将组件的每个元素解释为原始特征对每个PCA值的影响
感谢当您计算PCA时,您基本上计算(相关或协方差)矩阵的特征值和特征向量
所以实际上你可以计算多达1000个特征向量。当您设置n_组件=2时
你含蓄地说你只想计算前两个特征向量(与它们相关联的最大特征值)
组件
包含这些特征向量
它们很重要,因为它们编码了投影规则。它们允许您通过应用简单的矩阵乘法,从df
中样本所在的初始空间转到简化的二维空间
proyected_sample = a_sample * np.transpose( my_pca.components_ )