Python 重叠聚类的聚类评价方法

Python 重叠聚类的聚类评价方法,python,cluster-analysis,evaluation,Python,Cluster Analysis,Evaluation,我正在研究重叠子空间聚类中的聚类评估方法。然而,我仍然没有找到真正能帮助我度量集群质量的东西。到目前为止,我认为最适合我的是使用Jaccard索引。下图显示了重叠子空间聚类的示例 聚类的预期结果。 正如您所看到的,我可以看到行和列的重叠。因此,如果我使用传统的度量方法(例如ARI、剪影、DB),我不会考虑重叠来获取质量。有人在这方面做过研究吗?很抱歉,如果我错过了任何演示规则,这是我第一次在这里互动。您想评估什么?现有措施存在什么问题?您的示例数据在何处以及如何失败?你想换成什么?另外请注意,

我正在研究重叠子空间聚类中的聚类评估方法。然而,我仍然没有找到真正能帮助我度量集群质量的东西。到目前为止,我认为最适合我的是使用Jaccard索引。下图显示了重叠子空间聚类的示例

聚类的预期结果。


正如您所看到的,我可以看到行和列的重叠。因此,如果我使用传统的度量方法(例如ARI、剪影、DB),我不会考虑重叠来获取质量。有人在这方面做过研究吗?很抱歉,如果我错过了任何演示规则,这是我第一次在这里互动。

您想评估什么?现有措施存在什么问题?您的示例数据在何处以及如何失败?你想换成什么?另外请注意,这个网站更多的是针对实际的编程问题。我认为网络上有专门的计算机科学问题网站。但它可能仍然是本体论的。更准确地说,我不理解你所说的“考虑到重叠,它们没有捕获质量”是什么意思。也许其中一个可以更明确一点。嗨@Trilarion。我想评估聚类结果,例如,聚类X比聚类Y好?因此,我们可以使用ARI、剪影或其他方法来客观地评估结果。但是,当对象不重叠时,这样的度量很好,因为每个对象只属于一个簇。因此,如图所示,一个对象可以属于多个集群。我记得模糊聚类方法,现在我将看看它使用了什么策略。对不起,如果我离开了网站的目的。如果您对合适的站点有任何建议,我将非常感谢您的提示。我认为有些stackexchange站点可能存在这个问题。这些地点的范围重叠。除此之外的可能性可能是,或者,我想,但请先检查一下。Tkx,@Trilarion!我去看看。