r中的最优簇数_R_Machine Learning_Cluster Analysis_Data Mining

r中的最优簇数

r machine-learning

r中的最优簇数,r,machine-learning,cluster-analysis,data-mining,R,Machine Learning,Cluster Analysis,Data Mining,在关于如何选择簇数的本节中，其中一个图包含以下内容：这两个组成部分解释了100%的点可变性。它指的是什么组件？这些是x和y分量吗成分是主成分，例如对原始变量进行主成分分析的结果 clusplot（…）依赖于clusplot.default（…），文档中说明：。。。创建一个二元图，可视化数据。所有的观察都用图中的点来表示，使用主成分或多维缩放由于原始数据可以具有>2维（例如，两个以上的变量），并且聚类图被限制为2D，因此需要对原始数据执行某种降维。一种常用的方法是PCA，它创建一组新

在关于如何选择簇数的本节中，其中一个图包含以下内容：

这两个组成部分解释了100%的点可变性

。它指的是什么组件？这些是x和y分量吗

成分是主成分，例如对原始变量进行主成分分析的结果

clusplot（…）

依赖于

clusplot.default（…）

，文档中说明：

。。。创建一个二元图，可视化数据。所有的观察都用图中的点来表示，使用主成分或多维缩放

由于原始数据可以具有>2维（例如，两个以上的变量），并且聚类图被限制为2D，因此需要对原始数据执行某种降维。一种常用的方法是PCA，它创建一组新的变量作为原始变量集的线性组合。新变量被称为主成分，其特性是（通常）原始数据集中的大部分变量集中在前几个主成分中。所以

clusplot（…）

绘制PC2和PC1

如果原始数据集中只有两个维度，那么将只有两个PC，这些PC将占数据可变性的100%。我猜你的例子就是这样