R 识别群集中的数据点
我在R中创建一个k均值聚类。有人能帮我确定,如果形成了聚类,并且我想访问属于特定聚类的数据点,我该怎么做 这里有一个简单的例子:基于R 识别群集中的数据点,r,cluster-analysis,k-means,R,Cluster Analysis,K Means,我在R中创建一个k均值聚类。有人能帮我确定,如果形成了聚类,并且我想访问属于特定聚类的数据点,我该怎么做 这里有一个简单的例子:基于Petal.Length和Petal.Width的值,使用k-均值对iris集合进行聚类,使用三个中心: k_cluster <- kmeans(iris[c("Petal.Length","Petal.Width")], 3) #>k_cluster #K-means clustering with 3 clusters of sizes 50, 54
Petal.Length
和Petal.Width
的值,使用k-均值对iris
集合进行聚类,使用三个中心:
k_cluster <- kmeans(iris[c("Petal.Length","Petal.Width")], 3)
#>k_cluster
#K-means clustering with 3 clusters of sizes 50, 54, 46
#
#Cluster means:
# Petal.Length Petal.Width
#1 1.462000 0.246000
#2 4.292593 1.359259
#3 5.626087 2.047826
#Clustering vector:
# [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2
# [56] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 2 3 3 3
#[111] 3 3 3 3 3 3 3 3 3 2 3 3 3 2 3 3 2 2 3 3 3 3 3 3 3 3 3 3 2 3 3 3 3 3 3 3 3 3 3 3
#Within cluster sum of squares by cluster:
#[1] 2.02200 14.22741 15.16348
# (between_SS / total_SS = 94.3 %)
还有几种方法可以可视化集群。然而,鉴于目前提出这一问题的一般形式,似乎不宜进一步详述
希望这有帮助。请提供一些代码。这将使它更容易回答一个有用的方式。欢迎使用堆栈溢出!请阅读相关信息以及如何给出建议。这将使其他人更容易帮助你。
iris[k_cluster$cluster==3,]
#> head(iris[k_cluster$cluster==3,])
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#51 7.0 3.2 4.7 1.4 versicolor
#52 6.4 3.2 4.5 1.5 versicolor
#54 5.5 2.3 4.0 1.3 versicolor
#55 6.5 2.8 4.6 1.5 versicolor
#56 5.7 2.8 4.5 1.3 versicolor
#57 6.3 3.3 4.7 1.6 versicolor