R k-指生产;“计算奇异性”;错误
我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust软件包确定聚类数时,出现以下错误:R k-指生产;“计算奇异性”;错误,r,cluster-analysis,k-means,R,Cluster Analysis,K Means,我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust软件包确定聚类数时,出现以下错误: > library(NbClust) > set.seed(1234) > nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans") Error in solve.default(W) : system is computationally singular: reci
> library(NbClust)
> set.seed(1234)
> nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans")
Error in solve.default(W) :
system is computationally singular: reciprocal condition number = 1.50527e-17
In addition: Warning messages:
1: In pf(beale, pp, df2) : NaNs produced
2: In pf(beale, pp, df2) : NaNs produced
>库(NbClust)
>种子集(1234)
>ncWSS图表明它根本不起作用
这样的图表明可能只有一个集群
可能是由于预处理不充分,或者是因为该算法对于该数据是一个糟糕的选择。无论哪种方式,我都会假设结果不起作用。是否有可能您的某些列是相同的?虽然有几行在3列中共享相同的值(例如,第1行(5,8,10),第2行(5,8,10)),但没有相同的列。相同的行也会导致奇异矩阵。或者是其他行/列的线性组合的行/列。Hm,但为什么当我有41 x 14数据帧仍然包含相同的行时,它似乎在工作?我想这更像是一个统计/维度问题,而不是一个编程问题。可能比这里更适合stats.stackexchange,因为它似乎是关于k-means对极其稀疏的数据的适用性。