Geolocation 地理位置聚类

Geolocation 地理位置聚类,geolocation,location,cluster-analysis,k-means,dbscan,Geolocation,Location,Cluster Analysis,K Means,Dbscan,我有一个客户位置流数据,我需要分析和检查每个事件的位置是否是他通常访问的位置,如果不是他通常访问的位置,我需要实时生成警报。 我在研究各种聚类算法,但找不到一种“实时”的好算法 Kmeans对于中心点的数量太过严格。。DBSCAN的重量很重,不确定其速度是否足以实时响应 你能推荐一个适合实时流处理的吗 我认为DBSCAN足够合适。其最坏情况下的场景复杂度为O(n2),与其他传统算法(如分层算法)相比,这已经足够好了。与kmeans相比,我认为如果您使用空间数据库(如SpatiaLIte或Post

我有一个客户位置流数据,我需要分析和检查每个事件的位置是否是他通常访问的位置,如果不是他通常访问的位置,我需要实时生成警报。 我在研究各种聚类算法,但找不到一种“实时”的好算法

Kmeans对于中心点的数量太过严格。。DBSCAN的重量很重,不确定其速度是否足以实时响应


你能推荐一个适合实时流处理的吗

我认为DBSCAN足够合适。其最坏情况下的场景复杂度为O(n2),与其他传统算法(如分层算法)相比,这已经足够好了。与kmeans相比,我认为如果您使用空间数据库(如SpatiaLIte或PostGIS)中的ST_形心函数,kmeans是适用的(假定您使用地理数据)。
在kmeans和DBSCAN之间,我选择DBSCAN,因为我认为解决您的问题的方法是基于密度的实时数据方法。

一个好的DBSCAN实现可以很好地扩展。