Scikit learn HDBSCAN集群选择

Scikit learn HDBSCAN集群选择,scikit-learn,cluster-analysis,unsupervised-learning,hdbscan,Scikit Learn,Cluster Analysis,Unsupervised Learning,Hdbscan,我一直在使用HDBSCAN,并且基于我的数据拥有数百个集群。我试图选择一些集群组进行进一步分析。寻找具有高簇间距离的簇,例如比簇的其余部分更分散且表现为位异常值。到目前为止,我正在使用(-1)集群类别,但意识到集群。这些集群的概率是0。我需要这个值进行进一步分析 我的问题是: cluster.probabilities\uuscore对集群有什么影响 还有,除了选择-1集群类别之外,我还有什么方法可以选择一些可能存在异常值的其他集群?比如计算簇间距离或者其他方法 群集。概率表示给定数据点属于该群

我一直在使用
HDBSCAN
,并且基于我的数据拥有数百个集群。我试图选择一些集群组进行进一步分析。寻找具有高簇间距离的簇,例如比簇的其余部分更分散且表现为位异常值。到目前为止,我正在使用(
-1
)集群类别,但意识到
集群。这些集群的概率是
0
。我需要这个值进行进一步分析

我的问题是:

  • cluster.probabilities\uu
    score对集群有什么影响
  • 还有,除了选择
    -1
    集群类别之外,我还有什么方法可以选择一些可能存在异常值的其他集群?比如计算簇间距离或者其他方法
  • 群集。概率
    表示给定数据点属于该群集的概率

  • -1表示此数据点已标记为噪波。如果您希望分配它们,这可能是一个解决方案

  • 群集。概率
    表示给定数据点属于该群集的概率

  • -1表示此数据点已标记为噪波。如果您希望分配它们,这可能是一个解决方案