Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 如何将GPS坐标分组以表示一个特定的GPS位置(数据挖掘)_Database_Gps_Data Mining_K Means_Nearest Neighbor - Fatal编程技术网

Database 如何将GPS坐标分组以表示一个特定的GPS位置(数据挖掘)

Database 如何将GPS坐标分组以表示一个特定的GPS位置(数据挖掘),database,gps,data-mining,k-means,nearest-neighbor,Database,Gps,Data Mining,K Means,Nearest Neighbor,我有一个场景:我有一些GPS轨迹(经度、纬度)的数据,这些数据包含在两个部分中 包含数据(经度和纬度)的第一部分,这些数据是行程站(这些是实际坐标,必须在公交车开始行程时访问) 第二部分包含GPS坐标(经度和纬度),但可能是第一部分的2倍。每当公共汽车开始行驶时,它都会停在这些车站(已经给出了谁的坐标)。 我想通过比较访问的GPS站(实时坐标)和第一部分(预定坐标)来比较公交车是否完成了行程 但我的问题是: 我在第二部分中几乎有两个坐标,所有这些坐标彼此非常接近,几乎5-8个坐标表示同一个站(例

我有一个场景:我有一些GPS轨迹(经度、纬度)的数据,这些数据包含在两个部分中

包含数据(经度和纬度)的第一部分,这些数据是行程站(这些是实际坐标,必须在公交车开始行程时访问)

第二部分包含GPS坐标(经度和纬度),但可能是第一部分的2倍。每当公共汽车开始行驶时,它都会停在这些车站(已经给出了谁的坐标)。 我想通过比较访问的GPS站(实时坐标)和第一部分(预定坐标)来比较公交车是否完成了行程

但我的问题是: 我在第二部分中几乎有两个坐标,所有这些坐标彼此非常接近,几乎5-8个坐标表示同一个站(例如104578105888)和(104579105890)

什么是正确和可能的方式来声明某些协调员代表同一电台。这个问题也许可以用K近邻或K均值来解决


这个问题似乎没有很好的定义。但我想在查询时我会尝试解释更多。

创建一个第二部分坐标的凸包多边形,可能带有缓冲区,这样它会占用更大的区域,因此您可以考虑GPS误差,并在多边形搜索中进行点搜索


或者仅使用以计划点为中心的半径距离。

您可以使用lat lng对的空间索引。然后可以在曲线上查找闭合点并将它们分组。空间索引通常是空间填充曲线或四叉树。它使用一个四键索引二维并将其缩减为一维。它还保存了一些空间信息,可以用于许多事情。在Nick的空间索引四叉树希尔伯特博客中阅读更多关于它的文章。

< P>你是否考虑过使用一个简单的<强>阈值< /强>方法?i、 e.以一定距离合并坐标?看来你很有能力选择这样一个门槛

集群的问题在于,它会试图发现数据集中的结构

您似乎感兴趣的是,在一定距离内的对象的简单合并。没有你想要发现的“结构”。您希望进行预处理,而不是群集