r中的最优簇数

r中的最优簇数,r,machine-learning,cluster-analysis,data-mining,R,Machine Learning,Cluster Analysis,Data Mining,在关于如何选择簇数的本节中,其中一个图包含以下内容: 这两个组成部分解释了100%的点可变性 。它指的是什么组件?这些是x和y分量吗 成分是主成分,例如对原始变量进行主成分分析的结果 clusplot(…)依赖于clusplot.default(…),文档中说明: 。。。创建一个二元图,可视化 数据。所有的观察都用图中的点来表示, 使用主成分或多维缩放 由于原始数据可以具有>2维(例如,两个以上的变量),并且聚类图被限制为2D,因此需要对原始数据执行某种降维。一种常用的方法是PCA,它创建一组新

在关于如何选择簇数的本节中,其中一个图包含以下内容:

这两个组成部分解释了100%的点可变性

。它指的是什么组件?这些是x和y分量吗


成分是主成分,例如对原始变量进行主成分分析的结果

clusplot(…)
依赖于
clusplot.default(…)
,文档中说明:

。。。创建一个二元图,可视化 数据。所有的观察都用图中的点来表示, 使用主成分或多维缩放

由于原始数据可以具有>2维(例如,两个以上的变量),并且聚类图被限制为2D,因此需要对原始数据执行某种降维。一种常用的方法是PCA,它创建一组新的变量作为原始变量集的线性组合。新变量被称为主成分,其特性是(通常)原始数据集中的大部分变量集中在前几个主成分中。所以
clusplot(…)
绘制PC2和PC1

如果原始数据集中只有两个维度,那么将只有两个PC,这些PC将占数据可变性的100%。我猜你的例子就是这样