Python 澄清“的含义”;“装载量”;使用Sklearn
我一直在阅读sklearn中的PCA,特别是特性和组件之间的关系。我特别感兴趣的是识别与几个主要组件相关的特征重要性。然而,我发现一些帖子说了不同的话 例如,在中的3个答案中讨论了特征向量和载荷。特别是,Python 澄清“的含义”;“装载量”;使用Sklearn,python,scikit-learn,pca,Python,Scikit Learn,Pca,我一直在阅读sklearn中的PCA,特别是特性和组件之间的关系。我特别感兴趣的是识别与几个主要组件相关的特征重要性。然而,我发现一些帖子说了不同的话 例如,在中的3个答案中讨论了特征向量和载荷。特别是,pca.components\uuu.T*np.sqrt(pca.explained\u variance)显示了特征的组件加载。为什么这里使用sqrt?为什么是这个产品 但是,其中指出,abs(pca.components)为您提供了每个组件中的特征重要性。这似乎与上面所说的相矛盾,是吗?还指
pca.components\uuu.T*np.sqrt(pca.explained\u variance)
显示了特征的组件加载。为什么这里使用sqrt
?为什么是这个产品
但是,其中指出,abs(pca.components)
为您提供了每个组件中的特征重要性。这似乎与上面所说的相矛盾,是吗?还指示pca.components_uu
是每个特征的组件加载
此外,我无法理解如何回答这个问题:“我认为您所谓的“加载”是每个样本投影到组件所跨越的向量空间的结果。这些可以通过调用pca.fit(X_train)后调用pca.transform(X_train)来获得。”
但这是不正确的:载荷与主成分上每个特征的系数有关,而不是样本。同意吗
我真的很想在这里澄清一下