Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/354.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/lua/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Python中识别空间集群并考虑其他属性_Python_Cluster Analysis_Hierarchical Clustering - Fatal编程技术网

在Python中识别空间集群并考虑其他属性

在Python中识别空间集群并考虑其他属性,python,cluster-analysis,hierarchical-clustering,Python,Cluster Analysis,Hierarchical Clustering,我正在处理一个由空间地块组成的大型集合,每行包含地理坐标(UTM)、地块面积和价值: [x, y, area, value]: [272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393], [272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706], [271292.4197118982, 6132982.047648986, 634.438, 85

我正在处理一个由空间地块组成的大型集合,每行包含地理坐标(UTM)、地块面积和价值:

[x, y, area, value]:
[272564.9434265977, 6134243.108910706, 980.63, 550.6664083293393],
[272553.9611341293, 6134209.499155387, 1026.55, 477.32696897374706],
[271292.4197118982, 6132982.047648986, 634.438, 851.1469993915875],
...
绘制这些图形可以直观地识别几个不同的区域,其中美元价值因地理位置而异(例如,左侧的高价值地带是沿海地带):

我想确定价值集群(即海岸带)&研究了几种方法

  • K-means似乎是最容易实现的聚类方法,但是 不合适,因为只考虑点与点之间的距离 其他属性

  • 看起来非常适合此应用程序,但是 文档似乎只涉及使用GIS文件

  • DBSCAN似乎更相关,但我不确定如何包括我的 附加属性($value)-可能作为第三维度


有人能建议其他工具包/方法来考虑吗?< /P> < P>查看广义的dBSCAN(GbSCAN),它很容易允许你将邻居点都指向

  • 在距离阈值内(如在常规DBSCAN中)
  • 价格变动不超过10%(以防止沿海地区与常规地区合并)

  • 至少在层次聚类中,您可以定义只有“连接”的样本才能属于同一个聚类。在您的情况下,
    x
    y
    将由函数用于创建邻居列表,并且
    变量将在集群中使用

    在使用scikit了解如何实现DBSCAN时,请看这一点。