Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/templates/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 如何在python中对多维数据集进行集群?_Machine Learning_Cluster Analysis_Pca - Fatal编程技术网

Machine learning 如何在python中对多维数据集进行集群?

Machine learning 如何在python中对多维数据集进行集群?,machine-learning,cluster-analysis,pca,Machine Learning,Cluster Analysis,Pca,我一直在使用sklearn的kmeans和DBSCAN算法对具有2个特性的数据集进行聚类。我必须以非常高的维度对数据进行聚类,比如800-900,我想知道如何尽可能准确地实现 注:经过一些搜索,我已经意识到可以应用PCA进行降维,但我想知道,如果没有sklearn,在任何其他库中是否还有其他方法 您可以在高维数据上运行KMeans和DBSCAN 此外,重要的是内在维度。一个900维的数据集,其中898维为常数0,其行为与二维数据集完全相同,可能需要450倍的时间,但这是意料之中的

我一直在使用sklearn的kmeans和DBSCAN算法对具有2个特性的数据集进行聚类。我必须以非常高的维度对数据进行聚类,比如800-900,我想知道如何尽可能准确地实现

注:经过一些搜索,我已经意识到可以应用PCA进行降维,但我想知道,如果没有sklearn,在任何其他库中是否还有其他方法

您可以在高维数据上运行KMeans和DBSCAN

此外,重要的是内在维度。一个900维的数据集,其中898维为常数0,其行为与二维数据集完全相同,可能需要450倍的时间,但这是意料之中的