Python Scikit'中有哪些噪音样本;DBSCAN聚类算法?

Python Scikit'中有哪些噪音样本;DBSCAN聚类算法?,python,scikit-learn,cluster-analysis,dbscan,Python,Scikit Learn,Cluster Analysis,Dbscan,如果我在相似性矩阵上应用Scikit的DBSCAN(),我会得到一系列标签。其中一些标签是-1。文档称之为噪音样本 这些是什么?它们都属于一个集群,还是因为它们很吵,所以每个都属于自己的集群 谢谢这些不完全是集群的一部分。它们只是不属于任何集群的点,在某种程度上可以被“忽略” 请记住,DBSCAN代表“基于密度的带噪应用程序空间聚类”。DBSCAN检查以确保一个点在指定范围内有足够的邻居来将点分类到聚类中 但是,不符合任何主要集群标准的点会发生什么情况?如果一个点在指定半径内没有足够的邻居被视为

如果我在相似性矩阵上应用Scikit的DBSCAN(),我会得到一系列标签。其中一些标签是-1。文档称之为噪音样本

这些是什么?它们都属于一个集群,还是因为它们很吵,所以每个都属于自己的集群


谢谢

这些不完全是集群的一部分。它们只是不属于任何集群的点,在某种程度上可以被“忽略”

请记住,DBSCAN代表“基于密度的带噪应用程序空间聚类”。DBSCAN检查以确保一个点在指定范围内有足够的邻居来将点分类到聚类中

但是,不符合任何主要集群标准的点会发生什么情况?如果一个点在指定半径内没有足够的邻居被视为簇的一部分,该怎么办?这些点被赋予簇标签
-1
,被视为噪声

那又怎样?

嗯,如果你在分析数据点,你只对一般的聚类感兴趣,你可以降低数据的大小,减少噪音。或者,如果使用聚类分析对数据进行分类,在某些情况下,可以将噪声作为异常值丢弃


在异常检测中,不属于任何类别的点也很重要,因为它们可能代表问题或罕见事件。

也请阅读DBSCAN论文!以下是链接,以防其他人需要它: