Python 2.7 igraph社区检测结果重叠太多_Python 2.7_Cluster Analysis_Igraph_K Means

Python 2.7 igraph社区检测结果重叠太多

python-2.7

Python 2.7 igraph社区检测结果重叠太多,python-2.7,cluster-analysis,igraph,k-means,Python 2.7,Cluster Analysis,Igraph,K Means,我有一系列的观点（长，纬度） 1）找到所有点之间的哈弗森距离 2）将其保存到csv文件（源、目标、重量） 3）读取csv文件并生成加权图（其中权重是哈弗线距离） 4）使用igraphs社区检测算法-Fast贪婪我期望距离较低的集群彼此之间的距离较高，我期望类似于kmeans的东西（在空间中没有明显的分区），但结果中没有顺序问题: 为什么社区检测算法没有给我类似于kmeans聚类的结果？如果我使用相同的点/点之间的距离，那么为什么社区之间有这么多重叠？我只是在寻找一些直觉，来解释为什么

我有一系列的观点（长，纬度）

1）找到所有点之间的哈弗森距离 2）将其保存到csv文件（源、目标、重量） 3）读取csv文件并生成加权图（其中权重是哈弗线距离） 4）使用igraphs社区检测算法-Fast贪婪

我期望距离较低的集群彼此之间的距离较高，我期望类似于kmeans的东西（在空间中没有明显的分区），但结果中没有顺序

问题: 为什么社区检测算法没有给我类似于kmeans聚类的结果？如果我使用相同的点/点之间的距离，那么为什么社区之间有这么多重叠？我只是在寻找一些直觉，来解释为什么这并不像我预期的那样有效

谢谢你的方法不起作用，因为快速贪婪社区检测期望相似性作为权重，而不是距离

（事实上，这可能只是其中一个原因。另一个原因是igraph中的社区检测算法是为稀疏图设计的。如果您计算了所有点对之间的所有距离，那么您的图是稠密的，这些算法将不适用）.

DBSCAN和光学可能更适合这方面的算法。它们可以与哈弗森距离一起使用（例如，在ELKI中）。