Python sklearn MDS使我的内核崩溃?

Python sklearn MDS使我的内核崩溃?,python,numpy,scikit-learn,multi-dimensional-scaling,Python,Numpy,Scikit Learn,Multi Dimensional Scaling,我有一个50000 x 15 numpy的矩阵,有连续的数据。我想使用MDS(多维缩放)来缩小到2个组件,以便在二维向量空间中可视化数据。出于某种原因,每当我在数据上运行MDS时,我的内存和CPU%都会大幅增加,内核崩溃,告诉我需要重新启动。 有没有人遇到过类似的问题,或者知道是什么导致了这种情况 我使用的是MacBook Air、125GB SSD、4GB RAM,我的开发环境是Spyder IDE 谢谢我建议使用5%的随机样本运行MDS。 翻阅scikit文档,流形学习模块中的大多数算法的复

我有一个50000 x 15 numpy的矩阵,有连续的数据。我想使用MDS(多维缩放)来缩小到2个组件,以便在二维向量空间中可视化数据。出于某种原因,每当我在数据上运行MDS时,我的内存和CPU%都会大幅增加,内核崩溃,告诉我需要重新启动。 有没有人遇到过类似的问题,或者知道是什么导致了这种情况

我使用的是MacBook Air、125GB SSD、4GB RAM,我的开发环境是Spyder IDE


谢谢

我建议使用5%的随机样本运行MDS。 翻阅scikit文档,流形学习模块中的大多数算法的复杂性似乎都是O(n^2)。没有关于MDS的特定文档,但比较运行时,我只能假设MDS为n^2或更差。数据太多,算法效率低,内存小=内核崩溃


我建议使用5%的随机样本运行MDS。 翻阅scikit文档,流形学习模块中的大多数算法的复杂性似乎都是O(n^2)。没有关于MDS的特定文档,但比较运行时,我只能假设MDS为n^2或更差。数据太多,算法效率低,内存小=内核崩溃


我们当前的MDS实现基于smacof方法,该方法过于通用。在许多情况下,PCA/SVD可能更快。这是


同时,您可以直接使用
sklearn.decomposition.RandomizedPCA
而不是
MDS
类。

我们当前的MDS实现基于smacof方法,该方法过于通用。在许多情况下,PCA/SVD可能更快。这是


同时,您可以直接使用
sklearn.decomposition.RandomizedPCA
而不是
MDS
类。

+1我有一个类似的问题。我的内核没有崩溃,但计算即使在几个小时后也不会完成。我找到的唯一解决方案是使用上面推荐的小样本。+1我有一个类似的问题。我的内核没有崩溃,但计算即使在几个小时后也不会完成。我找到的唯一解决方案是使用上面推荐的小样本。