Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/google-chrome/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/sql-server-2008/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R k-指生产;“计算奇异性”;错误_R_Cluster Analysis_K Means - Fatal编程技术网

R k-指生产;“计算奇异性”;错误

R k-指生产;“计算奇异性”;错误,r,cluster-analysis,k-means,R,Cluster Analysis,K Means,我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust软件包确定聚类数时,出现以下错误: > library(NbClust) > set.seed(1234) > nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans") Error in solve.default(W) : system is computationally singular: reci

我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust软件包确定聚类数时,出现以下错误:

> library(NbClust)
> set.seed(1234)
> nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans")
Error in solve.default(W) : 
  system is computationally singular: reciprocal condition number = 1.50527e-17
In addition: Warning messages:
1: In pf(beale, pp, df2) : NaNs produced
2: In pf(beale, pp, df2) : NaNs produced
>库(NbClust)
>种子集(1234)

>ncWSS图表明它根本不起作用

这样的图表明可能只有一个集群


可能是由于预处理不充分,或者是因为该算法对于该数据是一个糟糕的选择。无论哪种方式,我都会假设结果不起作用。

是否有可能您的某些列是相同的?虽然有几行在3列中共享相同的值(例如,第1行(5,8,10),第2行(5,8,10)),但没有相同的列。相同的行也会导致奇异矩阵。或者是其他行/列的线性组合的行/列。Hm,但为什么当我有41 x 14数据帧仍然包含相同的行时,它似乎在工作?我想这更像是一个统计/维度问题,而不是一个编程问题。可能比这里更适合stats.stackexchange,因为它似乎是关于k-means对极其稀疏的数据的适用性。