Machine learning 在主成分分析（PCA）中使用4个成分_Machine Learning_Pca

Machine learning 在主成分分析（PCA）中使用4个成分

machine-learning

Machine learning 在主成分分析（PCA）中使用4个成分,machine-learning,pca,Machine Learning,Pca,我不知道如何解释主成分分析（PCA）和累积和图的输出我有以下问题。我有4台机器（A、B、C和D），每台机器都有9个特征，在这些特征中，测量是在同一时间进行的。目标是对机器行为进行分类我使用主成分分析从9个特征中减少维度。通过将原始特征空间投影到较小的子空间来降低其维数，然后绘制所有方差的累积和，可以看到前4个特征值对应于所有方差的大约82%。这意味着在降维过程中有18%的信息丢失我想基于主成分对机器进行聚类，但我发现的示例总是使用2个主成分（PC）绘制数据。这是我只用2台电脑绘制的图表如

我不知道如何解释主成分分析（PCA）和累积和图的输出

我有以下问题。我有4台机器（A、B、C和D），每台机器都有9个特征，在这些特征中，测量是在同一时间进行的。目标是对机器行为进行分类

我使用主成分分析从9个特征中减少维度。通过将原始特征空间投影到较小的子空间来降低其维数，然后绘制所有方差的累积和，可以看到前4个特征值对应于所有方差的大约82%。这意味着在降维过程中有18%的信息丢失

我想基于主成分对机器进行聚类，但我发现的示例总是使用2个主成分（PC）绘制数据。这是我只用2台电脑绘制的图表

如果累积和图显示4个PCs对应于所有方差的82%，并且PCA示例只有2个PCs，我该怎么办？我是否再次申请PCA？或者我需要做一些我不知道的事情

在[3]中，我展示了我必须使用PCA和2个组件的代码，并绘制了图形。A、B、C和D是机器

[3]

你打算用这些数据做什么？也就是说，这仅仅是为了在另一个ML算法中简化视图/特征工程，还是您打算用PCA输出直观地解释您的概念？@Denninger目标是根据特征对机器进行分类，以便我最终可以说哪台机器表现最好或最差。也许我需要在特征向量和特征值上应用另一个模型。但我不确定。

sklearn_pca = sklearnPCA(n_components=2)
Y_sklearn = sklearn_pca.fit_transform(X_std)

data = []

for name, col in zip(machine_list, colors.values()):

    trace = dict(
        type='scatter',
        x=Y_sklearn[y==name,0],
        y=Y_sklearn[y==name,1],
        mode='markers',
        name=name,
        marker=dict(
            color=col,
            size=12,
            line=dict(
                color='rgba(217, 217, 217, 0.14)',
                width=0.5),
            opacity=0.8)
    )
    data.append(trace)

layout = dict(
        xaxis=dict(title='PC1', showline=False),
        yaxis=dict(title='PC2', showline=False)
)
fig = dict(data=data, layout=layout)
iplot(fig)