Machine learning 可用的无监督分类方法

Machine learning 可用的无监督分类方法,machine-learning,svm,Machine Learning,Svm,我正在做一项涉及“无监督分类”的研究。 基本上,我有一个列车组,我想以无监督的方式将数据聚集在X个类中。这个想法和k-means的做法类似 比方说 步骤1) featureSet是一个[1057x10]矩阵,我想将它们分为88个集群 步骤2) 使用以前计算的类来计算testData是如何分类的 问题: -可以用SVM或N-N来做吗?别的? -还有其他建议吗?这听起来像是一个典型的集群问题。支持向量机和神经网络都不能直接解决这个问题。例如,您可以使用任一种方法将10维数据嵌入到二维空间中,但它们不

我正在做一项涉及“无监督分类”的研究。 基本上,我有一个列车组,我想以无监督的方式将数据聚集在X个类中。这个想法和k-means的做法类似

比方说

步骤1) featureSet是一个[1057x10]矩阵,我想将它们分为88个集群

步骤2) 使用以前计算的类来计算testData是如何分类的

问题: -可以用SVM或N-N来做吗?别的?
-还有其他建议吗?

这听起来像是一个典型的集群问题。支持向量机和神经网络都不能直接解决这个问题。例如,您可以使用任一种方法将10维数据嵌入到二维空间中,但它们不会为您将数据放入集群中


除了k-means外,还有大量的聚类算法。如果你想要一种对比的方法,你可能想尝试一种算法。我不知道您使用的是什么样的计算环境,但我非常喜欢和。

有许多集群算法,web上充斥着关于它们的信息和示例实现。一个很好的起点是关于聚类分析的维基百科条目


由于您有一个正常工作的k-means实现,您可以尝试多种变体中的一种,看看它们是否会产生更好的结果(k-means++可能,正如您提到的)。如果你想要一种完全不同的方法,可以看看Kohonen地图——也称为自组织特征地图。如果这看起来太棘手,那么简单的分层聚类将很容易实现(找到最近的两个项目,组合、清洗和重复)。

您是否确实尝试过使用k-means?它似乎很适合这个问题。事实上,我知道了。但我需要用不同的方法做同样的事情来比较结果。有什么建议吗?SVM是有监督的,不是无监督的,所以它不适合你想要的东西