Machine learning 聚类分析?为集群添加标签

Machine learning 聚类分析?为集群添加标签,machine-learning,classification,cluster-analysis,data-mining,Machine Learning,Classification,Cluster Analysis,Data Mining,我对以下两个问题感到困惑: 我有一个15维的数据集,该数据集应用于对数据集中包含的攻击类型进行聚类 一,。现在我已经将我的数据集分为5个集群(5次攻击)。有人知道我如何指出哪个集群是哪个攻击吗?(如何标记群集,而不仅仅是“群集1,群集2…”) 二,。在监督分类中,我们有训练数据集和测试数据集,并使用训练数据集构建的分类器进行测试。我的问题是,同样的方法可以用于集群吗。比如用聚类算法建立模型,然后自动将新实例分类到特定的集群中?这是可以实现的吗?无监督的方法如何能够识别命名攻击 人工指定的名称不在

我对以下两个问题感到困惑: 我有一个15维的数据集,该数据集应用于对数据集中包含的攻击类型进行聚类

一,。现在我已经将我的数据集分为5个集群(5次攻击)。有人知道我如何指出哪个集群是哪个攻击吗?(如何标记群集,而不仅仅是“群集1,群集2…”)


二,。在监督分类中,我们有训练数据集和测试数据集,并使用训练数据集构建的分类器进行测试。我的问题是,同样的方法可以用于集群吗。比如用聚类算法建立模型,然后自动将新实例分类到特定的集群中?这是可以实现的吗?

无监督的方法如何能够识别命名攻击

人工指定的名称不在数据中

对于某些集群算法,您可以自动分配新实例,但通常不能(不知道集群使用的模型)。在最坏的情况下,一个新的观测甚至会将两个集群合并为一个集群。那你打算怎么办

如果需要分类,请使用分类,而不是聚类

集群有着完全不同的思维方式。如果你从分类的角度来看,你将不会真正理解它。使用集群查找数据中未知的内容,使用分类概括新数据中已知的内容


如有必要,还可以在集群上训练分类器。但不要盲目地这样做。首先,确保集群实际上是有用的。产生一个完全没有意义的聚类结果要比产生一个好的聚类结果容易得多。在毫无价值的集群上训练分类器不会产生有意义的输出。

谢谢你的回答!现在我想尝试在我的集群上训练一个分类器。我不能回答这个问题,因为我不知道你使用什么软件。另外,我不经常使用分类。我使用WEKAAPI进行聚类。我不使用weka。你看过Weka的书吗?我对如何使用Weka有一个概述。现在我正在使用wekaapi进行集群,并完成了集群步骤,考虑如何标记集群。我是数据挖掘新手:)