Machine learning 在主成分分析(PCA)中使用4个成分

Machine learning 在主成分分析(PCA)中使用4个成分,machine-learning,pca,Machine Learning,Pca,我不知道如何解释主成分分析(PCA)和累积和图的输出 我有以下问题。我有4台机器(A、B、C和D),每台机器都有9个特征,在这些特征中,测量是在同一时间进行的。目标是对机器行为进行分类 我使用主成分分析从9个特征中减少维度。通过将原始特征空间投影到较小的子空间来降低其维数,然后绘制所有方差的累积和,可以看到前4个特征值对应于所有方差的大约82%。这意味着在降维过程中有18%的信息丢失 我想基于主成分对机器进行聚类,但我发现的示例总是使用2个主成分(PC)绘制数据。这是我只用2台电脑绘制的图表 如

我不知道如何解释主成分分析(PCA)和累积和图的输出

我有以下问题。我有4台机器(A、B、C和D),每台机器都有9个特征,在这些特征中,测量是在同一时间进行的。目标是对机器行为进行分类

我使用主成分分析从9个特征中减少维度。通过将原始特征空间投影到较小的子空间来降低其维数,然后绘制所有方差的累积和,可以看到前4个特征值对应于所有方差的大约82%。这意味着在降维过程中有18%的信息丢失

我想基于主成分对机器进行聚类,但我发现的示例总是使用2个主成分(PC)绘制数据。这是我只用2台电脑绘制的图表

如果累积和图显示4个PCs对应于所有方差的82%,并且PCA示例只有2个PCs,我该怎么办?我是否再次申请PCA?或者我需要做一些我不知道的事情

在[3]中,我展示了我必须使用PCA和2个组件的代码,并绘制了图形。A、B、C和D是机器

[3]


你打算用这些数据做什么?也就是说,这仅仅是为了在另一个ML算法中简化视图/特征工程,还是您打算用PCA输出直观地解释您的概念?@Denninger目标是根据特征对机器进行分类,以便我最终可以说哪台机器表现最好或最差。也许我需要在特征向量和特征值上应用另一个模型。但我不确定。
sklearn_pca = sklearnPCA(n_components=2)
Y_sklearn = sklearn_pca.fit_transform(X_std)

data = []

for name, col in zip(machine_list, colors.values()):

    trace = dict(
        type='scatter',
        x=Y_sklearn[y==name,0],
        y=Y_sklearn[y==name,1],
        mode='markers',
        name=name,
        marker=dict(
            color=col,
            size=12,
            line=dict(
                color='rgba(217, 217, 217, 0.14)',
                width=0.5),
            opacity=0.8)
    )
    data.append(trace)

layout = dict(
        xaxis=dict(title='PC1', showline=False),
        yaxis=dict(title='PC2', showline=False)
)
fig = dict(data=data, layout=layout)
iplot(fig)