Python 2.7 igraph社区检测结果重叠太多

Python 2.7 igraph社区检测结果重叠太多,python-2.7,cluster-analysis,igraph,k-means,Python 2.7,Cluster Analysis,Igraph,K Means,我有一系列的观点(长,纬度) 1) 找到所有点之间的哈弗森距离 2) 将其保存到csv文件(源、目标、重量) 3) 读取csv文件并生成加权图(其中权重是哈弗线距离) 4) 使用igraphs社区检测算法-Fast贪婪 我期望距离较低的集群彼此之间的距离较高,我期望类似于kmeans的东西(在空间中没有明显的分区),但结果中没有顺序 问题: 为什么社区检测算法没有给我类似于kmeans聚类的结果?如果我使用相同的点/点之间的距离,那么为什么社区之间有这么多重叠?我只是在寻找一些直觉,来解释为什么

我有一系列的观点(长,纬度)

1) 找到所有点之间的哈弗森距离 2) 将其保存到csv文件(源、目标、重量) 3) 读取csv文件并生成加权图(其中权重是哈弗线距离) 4) 使用igraphs社区检测算法-Fast贪婪

我期望距离较低的集群彼此之间的距离较高,我期望类似于kmeans的东西(在空间中没有明显的分区),但结果中没有顺序

问题: 为什么社区检测算法没有给我类似于kmeans聚类的结果?如果我使用相同的点/点之间的距离,那么为什么社区之间有这么多重叠?我只是在寻找一些直觉,来解释为什么这并不像我预期的那样有效


谢谢你的方法不起作用,因为快速贪婪社区检测期望相似性作为权重,而不是距离


(事实上,这可能只是其中一个原因。另一个原因是igraph中的社区检测算法是为稀疏图设计的。如果您计算了所有点对之间的所有距离,那么您的图是稠密的,这些算法将不适用).

DBSCAN和光学可能更适合这方面的算法。它们可以与哈弗森距离一起使用(例如,在ELKI中)。