Python 基于数据框架的主成分分析
如何从pandas数据框中的数据计算主成分分析?大多数对象都可以使用Python 基于数据框架的主成分分析,python,pandas,pca,scientific-computing,principal-components,Python,Pandas,Pca,Scientific Computing,Principal Components,如何从pandas数据框中的数据计算主成分分析?大多数对象都可以使用pandas数据框很好,您喜欢这样吗 import pandas as pd import numpy as np from sklearn.decomposition import PCA df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10))) pca = PCA(n_components=5) pca.fit(df) 您可以使用访问组件本身 pca.compon
pandas
数据框很好,您喜欢这样吗
import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))
pca = PCA(n_components=5)
pca.fit(df)
您可以使用访问组件本身
pca.components_
这很有效。这可能是一个有趣的补充:与数组相反,数据帧通常也很方便。要做到这一点,可以做一些类似的事情:pandas.DataFrame(pca.transform(df),columns=['pca%i'%i for i in range(n_components)],index=df.index),其中我设置了n_components=5。此外,代码上方的文本中有输入错误,“panadas”应该是“pandas”。)在我的例子中,我想要的是组件,而不是转换,因此采用@Moot的语法,我使用了
df=pandas.DataFrame(pca.components)
。最后一个注意事项是,如果您要尝试将此新的df
用于dot产品,请确保查看以下链接:[