在Python中识别空间集群并考虑其他属性_Python_Cluster Analysis_Hierarchical Clustering

在Python中识别空间集群并考虑其他属性

python

在Python中识别空间集群并考虑其他属性,python,cluster-analysis,hierarchical-clustering,Python,Cluster Analysis,Hierarchical Clustering,我正在处理一个由空间地块组成的大型集合，每行包含地理坐标（UTM）、地块面积和价值： [x, y, area, value]: [272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393], [272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706], [271292.4197118982, 6132982.047648986, 634.438, 85

我正在处理一个由空间地块组成的大型集合，每行包含地理坐标（UTM）、地块面积和价值：

[x, y, area, value]:
[272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393],
[272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706],
[271292.4197118982, 6132982.047648986, 634.438, 851.1469993915875],
...

绘制这些图形可以直观地识别几个不同的区域，其中美元价值因地理位置而异（例如，左侧的高价值地带是沿海地带）：

我想确定价值集群（即海岸带）&研究了几种方法

K-means似乎是最容易实现的聚类方法，但是不合适，因为只考虑点与点之间的距离其他属性
看起来非常适合此应用程序，但是文档似乎只涉及使用GIS文件
DBSCAN似乎更相关，但我不确定如何包括我的附加属性（$value）-可能作为第三维度

有人能建议其他工具包/方法来考虑吗？< /P> < P>查看广义的dBSCAN（GbSCAN），它很容易允许你将邻居点都指向

在距离阈值内（如在常规DBSCAN中）

价格变动不超过10%（以防止沿海地区与常规地区合并）

至少在层次聚类中，您可以定义只有“连接”的样本才能属于同一个聚类。在您的情况下，

和

将由函数用于创建邻居列表，并且

值

变量将在集群中使用

在使用scikit了解如何实现DBSCAN时，请看这一点。