Algorithm 有没有一种根据Jaccard相似性对图进行聚类的有效方法?

Algorithm 有没有一种根据Jaccard相似性对图进行聚类的有效方法?,algorithm,cluster-analysis,graph-algorithm,hierarchical-clustering,Algorithm,Cluster Analysis,Graph Algorithm,Hierarchical Clustering,是否有一种有效的方法使用Jaccard相似性对图中的节点进行聚类,使每个聚类至少有K个节点 节点i和j之间的相似性:设S为i的邻域集,T为j的邻域集。然后,i和j之间的相似性由|(S)给出⋂ T) |/|(S)⋃ T) |您自己尝试过实现一些算法吗 计算所有成对的非零相似性(即,当它们至少有一个共同的邻居时;这使得候选集比平方矩阵小得多) 按相似性对它们进行排序,并按相似性递减的方式处理对。最初,每个对象都是它们自己的集群 如果A和B还不在同一个集群中,且任一集群的成员数少于k,则加入这两个集群

是否有一种有效的方法使用Jaccard相似性对图中的节点进行聚类,使每个聚类至少有
K
个节点


节点
i
j
之间的相似性:
S
i
的邻域集,
T
j
的邻域集。然后,
i
j
之间的相似性由
|(S)给出⋂ T) |/|(S)⋃ T) |

您自己尝试过实现一些算法吗

计算所有成对的非零相似性(即,当它们至少有一个共同的邻居时;这使得候选集比平方矩阵小得多)

按相似性对它们进行排序,并按相似性递减的方式处理对。最初,每个对象都是它们自己的集群

如果A和B还不在同一个集群中,且任一集群的成员数少于k,则加入这两个集群。重复此步骤,直到处理完所有相似性

请注意,您可能仍然拥有少于k个成员的集群。例如,如果数据集的节点总数少于k个,或者存在未连接的小子图等


您确实应该接受少于k个节点的集群,即未集群节点。为什么一切都会聚集在一起?真实数据中总是会有异常值和噪声。

图中描述的是什么格式?如中所示,它是邻接列表、邻接矩阵等吗?图是可靠的稀疏图还是稠密图?您知道随着图形的增长,节点的阶数是如何变化的吗?(特别是,它是否保持不变?是否线性增加?)该图被描述为一个邻接列表,应该是稀疏的。好的。你想要什么样的集群?最大化最小簇内相似性度量的簇?最小化平均簇间相似性度量的簇?等等。下一步:你想要绝对最优的聚类吗?如果不是,你会接受多差的近似值?最大化簇内相似性的簇。我最好是寻找最佳的解决方案,虽然一个好的近似算法是可以接受的。