Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 层次聚类-图上的聚类数_R_Cluster Computing_Cluster Analysis_Hierarchical Clustering - Fatal编程技术网

R 层次聚类-图上的聚类数

R 层次聚类-图上的聚类数,r,cluster-computing,cluster-analysis,hierarchical-clustering,R,Cluster Computing,Cluster Analysis,Hierarchical Clustering,我正在绘制一个图,但是我不想得到图上的点,而是想让图显示哪些簇对应于这些点。我制作的图表可以在附件中看到。因此,我希望它有对应于簇的数字,而不是包含点的图。我留下了另一张图片,作为我或多或少想要的例子。此示例图表包含相应群集的编号。 我使用的是分层聚类。代码如下。 谢谢你的帮助 library(readxl) complete_data <- read_excel('C:/Users/Jovani Souza/Word/Cluster/test2.xlsx') nproperty<

我正在绘制一个图,但是我不想得到图上的点,而是想让图显示哪些簇对应于这些点。我制作的图表可以在附件中看到。因此,我希望它有对应于簇的数字,而不是包含点的图。我留下了另一张图片,作为我或多或少想要的例子。此示例图表包含相应群集的编号。 我使用的是分层聚类。代码如下。 谢谢你的帮助

library(readxl)
complete_data <- read_excel('C:/Users/Jovani Souza/Word/Cluster/test2.xlsx') 
nproperty<-dim(complete_data)[2]

coordinates<- complete_data [,1:2] #matrix containing latitude and longitude
d<-dist(coordinates)
fit.average<-hclust(d,method="average") 

#########varying the value of k
mean<-matrix (nrow= nproperty-2,ncol=2)
standard_deviation<-matrix(nrow=npropriedades-2,ncol=2)

for(k in 2:nproperty-1){
clusters<-cutree(fit.average, k) # set the number of k clusters
nclusters<-matrix(table(clusters))  #to indicate how many properties are in each cluster

########inserting column with determination of clusters
complete_data$cluster <- clusters 

#########calculate center of mass
mass_center<-matrix(nrow=k,ncol=2)
for(i in 1:k){
mass_center[i,]<-c(weighted.mean(subset(complete_data,cluster==i)$Latitude,subset(complete_data,cluster==i)$Production),
weighted.mean(subset(complete_data,cluster==i)$Longitude,subset(complete_data,cluster==i)$Production))}

coordinates$cluster<-clusters #including clusters index
mass_center<-cbind(mass_center,matrix(c(1:k),ncol=1)) #including clusters index

###############calculation of clusters coverage, considered as the largest distance between properties and center of mass
coverage<-matrix(nrow=k,ncol=1)
for(i in 1:k){
aux_dist<-pdist(rbind(subset(coordinates, cluster==i),mass_center[i,]))
coverage[i,]<-max(aux_dist[nclusters[i,1]+1,])}

###########Production sum of the clusters
sum_production<-matrix(nrow=k,ncol=1)
for(i in 1:k){
sum_production[i,]<-sum(subset(complete_data,cluster==i)["Production"])
}

###########mean of coverage and biogás
mean[k-1,]<-c(mean(coverage),mean(sum_production)) #ver como nomear colunas
standard_deviation[k-1,]<-c(sd(coverage),sd(sum_production))
}

colnames(mean)<-c("Coverage","Production")
colnames(standard_deviation)<-c("Coverage","Production")

plot(mean)
库(readxl)

完整的_数据您没有提供最小的可重复性示例,但下面是一些模拟数据,以演示实现这一点的一种方法:


complete\u数据非常感谢您的朋友。在我的例子中,我的基地有10个集群。如何通过选择簇2到簇8生成图形?请用户12728748提供任何建议?以供将来参考:。