在Python中识别空间集群并考虑其他属性
我正在处理一个由空间地块组成的大型集合,每行包含地理坐标(UTM)、地块面积和价值:在Python中识别空间集群并考虑其他属性,python,cluster-analysis,hierarchical-clustering,Python,Cluster Analysis,Hierarchical Clustering,我正在处理一个由空间地块组成的大型集合,每行包含地理坐标(UTM)、地块面积和价值: [x, y, area, value]: [272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393], [272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706], [271292.4197118982, 6132982.047648986, 634.438, 85
[x, y, area, value]:
[272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393],
[272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706],
[271292.4197118982, 6132982.047648986, 634.438, 851.1469993915875],
...
绘制这些图形可以直观地识别几个不同的区域,其中美元价值因地理位置而异(例如,左侧的高价值地带是沿海地带):
我想确定价值集群(即海岸带)&研究了几种方法
- K-means似乎是最容易实现的聚类方法,但是 不合适,因为只考虑点与点之间的距离 其他属性
- 看起来非常适合此应用程序,但是 文档似乎只涉及使用GIS文件
- DBSCAN似乎更相关,但我不确定如何包括我的 附加属性($value)-可能作为第三维度
有人能建议其他工具包/方法来考虑吗?< /P> < P>查看广义的dBSCAN(GbSCAN),它很容易允许你将邻居点都指向
至少在层次聚类中,您可以定义只有“连接”的样本才能属于同一个聚类。在您的情况下,
x
和y
将由函数用于创建邻居列表,并且值
变量将在集群中使用 在使用scikit了解如何实现DBSCAN时,请看这一点。