Python 基于数据框架的主成分分析_Python_Pandas_Pca_Scientific Computing_Principal Components

Python 基于数据框架的主成分分析

python pandas

Python 基于数据框架的主成分分析,python,pandas,pca,scientific-computing,principal-components,Python,Pandas,Pca,Scientific Computing,Principal Components,如何从pandas数据框中的数据计算主成分分析？大多数对象都可以使用pandas数据框很好，您喜欢这样吗 import pandas as pd import numpy as np from sklearn.decomposition import PCA df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10))) pca = PCA(n_components=5) pca.fit(df) 您可以使用访问组件本身 pca.compon

如何从pandas数据框中的数据计算主成分分析？

大多数对象都可以使用

pandas

数据框很好，您喜欢这样吗

import pandas as pd
import numpy as np
from sklearn.decomposition import PCA

df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))

pca = PCA(n_components=5)
pca.fit(df)

您可以使用访问组件本身

pca.components_

这很有效。这可能是一个有趣的补充：与数组相反，数据帧通常也很方便。要做到这一点，可以做一些类似的事情：pandas.DataFrame（pca.transform（df），columns=['pca%i'%i for i in range（n_components）]，index=df.index），其中我设置了n_components=5。此外，代码上方的文本中有输入错误，“panadas”应该是“pandas”。）在我的例子中，我想要的是组件，而不是转换，因此采用@Moot的语法，我使用了

df=pandas.DataFrame（pca.components）

。最后一个注意事项是，如果您要尝试将此新的

df

用于dot产品，请确保查看以下链接：[