有没有一种方法可以确定用于R聚类的不同属性的权重?
我正在使用~70个属性使用K-means和分层技术创建集群(可能最终使用混合的分层K-means集群技术)。有没有办法找出70个属性中哪一个在最终聚类中的权重更大?或者哪些属性在确定最终簇时似乎更重要/更偏激?我在R运行这个。谢谢 您可以使用:有没有一种方法可以确定用于R聚类的不同属性的权重?,r,cluster-analysis,k-means,hierarchical,R,Cluster Analysis,K Means,Hierarchical,我正在使用~70个属性使用K-means和分层技术创建集群(可能最终使用混合的分层K-means集群技术)。有没有办法找出70个属性中哪一个在最终聚类中的权重更大?或者哪些属性在确定最终簇时似乎更重要/更偏激?我在R运行这个。谢谢 您可以使用: 库(FeatureImpCluster) 库(clustMixType) 如果70个属性具有不同的比例,则返回数据(例如,有些从0到1000不等,有些从0到1不等,那么值越大的属性越重要。假设您首先对属性进行标准化,使其处于相等的比例,计算每个组的每个属
库(FeatureImpCluster)
库(clustMixType)
如果70个属性具有不同的比例,则返回数据(例如,有些从0到1000不等,有些从0到1不等,那么值越大的属性越重要。假设您首先对属性进行标准化,使其处于相等的比例,计算每个组的每个属性的平均值,并查看平均值的范围。组间具有更多可变平均值的属性在识别时更有用。)这就是集群的不同之处。
library(FeatureImpCluster)
library(clustMixType)
data <- as.data.table(iris)
res <- kproto(x=data,k=4)
FeatureImp_res <- FeatureImpCluster(res,data)
plot(FeatureImp_res,data,color="type")