我应该使用哪个数据集来计算Calinski-Harabasz指数?

我应该使用哪个数据集来计算Calinski-Harabasz指数?,r,cluster-analysis,pca,R,Cluster Analysis,Pca,我正在对最重要的成分进行聚类分析。 为了找到集群的数量,我应用了卡林斯基-哈拉巴斯索引。我有两个问题: 我是否需要在集群之前规范化组件。到目前为止,我还没有这样做,因为方差表示组件的重要性。 关于CH指数,我是根据原始数据计算还是根据pca函数的输出计算?我试图澄清: pca <- prcomp(data_scaled) pca$x pca查看包clusterCrit。好的,这实际上帮助很大。我需要根据原始(缩放)数据进行计算。

我正在对最重要的成分进行聚类分析。 为了找到集群的数量,我应用了卡林斯基-哈拉巴斯索引。我有两个问题: 我是否需要在集群之前规范化组件。到目前为止,我还没有这样做,因为方差表示组件的重要性。 关于CH指数,我是根据原始数据计算还是根据pca函数的输出计算?我试图澄清:

pca <- prcomp(data_scaled)
pca$x

pca查看包
clusterCrit
。好的,这实际上帮助很大。我需要根据原始(缩放)数据进行计算。