Cluster analysis 用于极低方差数据聚类的数据预处理

Cluster analysis 用于极低方差数据聚类的数据预处理,cluster-analysis,k-means,feature-selection,dbscan,optics-algorithm,Cluster Analysis,K Means,Feature Selection,Dbscan,Optics Algorithm,我试图对生产机器的数据进行聚类。我正在尝试K-Means、DB-SCAN和光学。对于所有算法,结果都非常糟糕(例如轮廓系数为0.05) 从我的观点来看,数据的方差很小。我已经做了主成分分析,前两个主成分只占数据集变量的6%。下图显示了前两个主成分的直方图和散点图 对于数据预处理,我尝试了标准化、最小-最大缩放、方差阈值特征选择(sklearn)、单变量特征选择(sklearn)和上述PCA。结果并不令人满意 所以我的问题是,是否有任何其他方法的数据准备,你可以认为是有助于我的聚类。或者如果数据根

我试图对生产机器的数据进行聚类。我正在尝试K-Means、DB-SCAN和光学。对于所有算法,结果都非常糟糕(例如轮廓系数为0.05)

从我的观点来看,数据的方差很小。我已经做了主成分分析,前两个主成分只占数据集变量的6%。下图显示了前两个主成分的直方图和散点图

对于数据预处理,我尝试了标准化、最小-最大缩放、方差阈值特征选择(sklearn)、单变量特征选择(sklearn)和上述PCA。结果并不令人满意

所以我的问题是,是否有任何其他方法的数据准备,你可以认为是有助于我的聚类。或者如果数据根本不适合进行聚类:D

谢谢你的评论


您能对数据集进行聚类并发布结果的图表吗?从2个特性开始,然后添加3、4、5等。它在哪里变得奇怪?你提到的所有集群算法,只需按照你告诉他们的去做。有些数据集可能无法很好地聚集。谢谢您的建议。我从两个特性开始,结果很好,请看我在问题中添加的特性。我添加的每一项功能都会减少轮廓,另请参见带有5项功能的图片。