Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/365.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于数据框架的主成分分析_Python_Pandas_Pca_Scientific Computing_Principal Components - Fatal编程技术网

Python 基于数据框架的主成分分析

Python 基于数据框架的主成分分析,python,pandas,pca,scientific-computing,principal-components,Python,Pandas,Pca,Scientific Computing,Principal Components,如何从pandas数据框中的数据计算主成分分析?大多数对象都可以使用pandas数据框很好,您喜欢这样吗 import pandas as pd import numpy as np from sklearn.decomposition import PCA df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10))) pca = PCA(n_components=5) pca.fit(df) 您可以使用访问组件本身 pca.compon

如何从pandas数据框中的数据计算主成分分析?

大多数对象都可以使用
pandas
数据框很好,您喜欢这样吗

import pandas as pd
import numpy as np
from sklearn.decomposition import PCA

df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))

pca = PCA(n_components=5)
pca.fit(df)
您可以使用访问组件本身

pca.components_ 

这很有效。这可能是一个有趣的补充:与数组相反,数据帧通常也很方便。要做到这一点,可以做一些类似的事情:pandas.DataFrame(pca.transform(df),columns=['pca%i'%i for i in range(n_components)],index=df.index),其中我设置了n_components=5。此外,代码上方的文本中有输入错误,“panadas”应该是“pandas”。)在我的例子中,我想要的是组件,而不是转换,因此采用@Moot的语法,我使用了
df=pandas.DataFrame(pca.components)
。最后一个注意事项是,如果您要尝试将此新的
df
用于dot产品,请确保查看以下链接:[