Algorithm 有没有一种根据Jaccard相似性对图进行聚类的有效方法？_Algorithm_Cluster Analysis_Graph Algorithm_Hierarchical Clustering

Algorithm 有没有一种根据Jaccard相似性对图进行聚类的有效方法？

algorithm

Algorithm 有没有一种根据Jaccard相似性对图进行聚类的有效方法？,algorithm,cluster-analysis,graph-algorithm,hierarchical-clustering,Algorithm,Cluster Analysis,Graph Algorithm,Hierarchical Clustering,是否有一种有效的方法使用Jaccard相似性对图中的节点进行聚类，使每个聚类至少有K个节点节点i和j之间的相似性：设S为i的邻域集，T为j的邻域集。然后，i和j之间的相似性由|（S）给出⋂ T） |/|（S）⋃ T） |您自己尝试过实现一些算法吗计算所有成对的非零相似性（即，当它们至少有一个共同的邻居时；这使得候选集比平方矩阵小得多）按相似性对它们进行排序，并按相似性递减的方式处理对。最初，每个对象都是它们自己的集群如果A和B还不在同一个集群中，且任一集群的成员数少于k，则加入这两个集群

是否有一种有效的方法使用Jaccard相似性对图中的节点进行聚类，使每个聚类至少有

个节点

节点

和

之间的相似性：
设

为

的邻域集，

为

的邻域集。然后，

和

之间的相似性由

|（S）给出⋂ T） |/|（S）⋃ T） |

您自己尝试过实现一些算法吗

计算所有成对的非零相似性（即，当它们至少有一个共同的邻居时；这使得候选集比平方矩阵小得多）

按相似性对它们进行排序，并按相似性递减的方式处理对。最初，每个对象都是它们自己的集群

如果A和B还不在同一个集群中，且任一集群的成员数少于k，则加入这两个集群。重复此步骤，直到处理完所有相似性

请注意，您可能仍然拥有少于k个成员的集群。例如，如果数据集的节点总数少于k个，或者存在未连接的小子图等

您确实应该接受少于k个节点的集群，即未集群节点。为什么一切都会聚集在一起？真实数据中总是会有异常值和噪声。

图中描述的是什么格式？如中所示，它是邻接列表、邻接矩阵等吗？图是可靠的稀疏图还是稠密图？您知道随着图形的增长，节点的阶数是如何变化的吗？（特别是，它是否保持不变？是否线性增加？）该图被描述为一个邻接列表，应该是稀疏的。好的。你想要什么样的集群？最大化最小簇内相似性度量的簇？最小化平均簇间相似性度量的簇？等等。下一步：你想要绝对最优的聚类吗？如果不是，你会接受多差的近似值？最大化簇内相似性的簇。我最好是寻找最佳的解决方案，虽然一个好的近似算法是可以接受的。