Python 在GPS数据上运行DBSCAN:内存错误
对于我目前正在进行的一个项目,我需要将相对大量的GPS对聚集到不同的位置簇中。在阅读了StackOverflow中的许多帖子和建议并采取了不同的方法之后,我仍然存在运行它的问题 数据集大小:略多于20万对GPS坐标Python 在GPS数据上运行DBSCAN:内存错误,python,gps,dbscan,elki,Python,Gps,Dbscan,Elki,对于我目前正在进行的一个项目,我需要将相对大量的GPS对聚集到不同的位置簇中。在阅读了StackOverflow中的许多帖子和建议并采取了不同的方法之后,我仍然存在运行它的问题 数据集大小:略多于20万对GPS坐标 [[108.67235 22.38068 ] [110.579506 16.173908] [111.34595 23.1978 ] ... [118.50778 23.03158 ] [118.79726 23.83771 ] [123.088512
[[108.67235 22.38068 ]
[110.579506 16.173908]
[111.34595 23.1978 ]
...
[118.50778 23.03158 ]
[118.79726 23.83771 ]
[123.088512 21.478443]]
尝试的方法:
1.HDBSCAN包
coordinates = df5.values
print(coordinates)
clusterer = hdbscan.HDBSCAN(metric='haversine', min_cluster_size=15)
clusterer.fit(coordinates)
内存错误没有意义。因为DBSCAN只需要O(n)内存,所以如果有足够的时间,您应该能够在raspberry pi上运行它。请提供内存转储和其他诊断数据,而不仅仅是模糊的“内存不足”描述。也许你打开的东西太多了?什么天的大小仍然有效?只是为了记录:200k点需要大约3.5MB内存。即使有一些开销,DBSCAN也应该能够用几兆字节的RAM(而不是千兆字节)轻松地处理这个问题。显示真正的错误消息@Anony Mousse嗨!!你是我的幸运星!不管出于什么原因,今天早上我试着用DBSCAN运行它,作为我一天的开始,它成功了!:)谢谢你也许应该少打开一些东西&不时检查任务管理器,看看是什么进程耗尽了你的内存。。。不时关闭你不使用的狗舍!