Machine learning 如何在python中对多维数据集进行集群?
我一直在使用sklearn的kmeans和DBSCAN算法对具有2个特性的数据集进行聚类。我必须以非常高的维度对数据进行聚类,比如800-900,我想知道如何尽可能准确地实现 注:经过一些搜索,我已经意识到可以应用PCA进行降维,但我想知道,如果没有sklearn,在任何其他库中是否还有其他方法 您可以在高维数据上运行KMeans和DBSCAN 此外,重要的是内在维度。一个900维的数据集,其中898维为常数0,其行为与二维数据集完全相同,可能需要450倍的时间,但这是意料之中的Machine learning 如何在python中对多维数据集进行集群?,machine-learning,cluster-analysis,pca,Machine Learning,Cluster Analysis,Pca,我一直在使用sklearn的kmeans和DBSCAN算法对具有2个特性的数据集进行聚类。我必须以非常高的维度对数据进行聚类,比如800-900,我想知道如何尽可能准确地实现 注:经过一些搜索,我已经意识到可以应用PCA进行降维,但我想知道,如果没有sklearn,在任何其他库中是否还有其他方法 您可以在高维数据上运行KMeans和DBSCAN 此外,重要的是内在维度。一个900维的数据集,其中898维为常数0,其行为与二维数据集完全相同,可能需要450倍的时间,但这是意料之中的