Routing 评估国际路线的OpenStreetMap

Routing 评估国际路线的OpenStreetMap,routing,gis,geospatial,openstreetmap,geonames,Routing,Gis,Geospatial,Openstreetmap,Geonames,我一直在为北美和西欧/中欧的路线距离和旅行时间使用商业解决方案。我正在考虑将该项目扩大到其他国家——也许是全世界。由于预算非常有限,而且个别商业提供商的区域覆盖范围参差不齐,本地托管的OpenStreetMap可能成为唯一可行的选择。在有人提出在线解决方案之前,我的应用程序需要大量密集的路线计算——如果使用web服务执行,这将花费很多成本,或者是非常不礼貌(可能被禁止)。计算结果被放回公共领域,因此重新发布OpenStreetMaps不是问题 我的问题是如何评估OpenStreetMap数据库中

我一直在为北美和西欧/中欧的路线距离和旅行时间使用商业解决方案。我正在考虑将该项目扩大到其他国家——也许是全世界。由于预算非常有限,而且个别商业提供商的区域覆盖范围参差不齐,本地托管的OpenStreetMap可能成为唯一可行的选择。在有人提出在线解决方案之前,我的应用程序需要大量密集的路线计算——如果使用web服务执行,这将花费很多成本,或者是非常不礼貌(可能被禁止)。计算结果被放回公共领域,因此重新发布OpenStreetMaps不是问题

我的问题是如何评估OpenStreetMap数据库中各个国家的路由数据覆盖率?这样的评估可以确定项目是否可行,以及处理的适当顺序(即首先确定覆盖率最高的国家)

高端商业数据提供商通常可以提供统计描述,以及调查覆盖范围的区域描述。OpenStreetMap更加零散——一个区域通常包括一些道路,但不是所有的道路。对于我的应用程序来说,几米甚至10-20米的个别位置错误都不会是问题(我正在查看城市距离),但路线图连通性是。即,道路矢量在逻辑上必须在交叉点处正确相交

是否有人试图创建描述OpenStreetMap数据库数据覆盖率的统计数据

如果没有,你会怎么做

我能想到的最好办法是对一些地方(如城市)进行随机抽样,然后尝试计算路线。必须假设主要道路将倾向于在次要道路之前添加。因此,两个遥远城市之间的路线将使用符合逻辑的主要道路,而不是次要道路(通常较长/较慢),因为主要道路缺失

另一个问题是,在许多城镇之间开车实际上是不可能的。这通常是由于存在岛屿(可以使用渡船),但通常没有地面路线(例如努纳武特的定居点)。那么,在比较(比如)汤加和阿富汗时,这些统计数据将如何使用呢。Afganistan的数据覆盖率可能很低。汤加可能更好,但定居点分布在一个群岛上


关于我的应用程序的一些细节:所有的起点和终点都是城镇,其位置取自Geonames数据库。通常,我会在一个拥有至少1000人口的国家里考察1000个最大的城市。目前,路线计算为两个最快路线和最短路线。合理的道路速度因广泛的道路类别而异。估计行程时间是沿着道路距离计算的。这些细节是一致性的首选项-它们不是一成不变的。

你可能会在

上得到一系列更好的答案。有许多举措可以描述OpenStreetMap的质量,但它们都局限于特定的领域。Muki Haklay对OpenStreetMap的数据质量进行了广泛的研究。许多定量结果与英国有关。如果你想了解OpenStreetMap的总体质量,它是一个主要的资源,而这不仅仅是数据完整性这是他对英国OpenStreetMap完整性的评估。A(PDF)最近发布

问题是,为了度量完整性,您需要一个精确的参考数据集来进行度量。你可以用TeleAtlas或NAVTEQ数据来做这件事,但这是昂贵的数据,而且这些公司不会轻易将数据用于研究目的。政府数据也可能是合适的,但并不总是可用的,或者像美国那样,完全过时和不准确。事实上,OpenStreetMap通过大量导入启动了美国的地图工作,该数据集从未用于路由/导航,并且是一个拓扑混乱的数据集。志愿者们正努力改进这些数据,但进展缓慢

如果您想自己尝试生成定量质量指标,那么最好与OpenStreetMap社区合作,了解数据模型,并查看它如何与您正在尝试的工作相匹配。什么构成“路由数据”?显然,道路和渡轮航线本身就是如此。转弯限制?最高速度?道路质量?分数?这可能是一个很好的起点。我的猜测是,在预算有限的情况下,你需要做出很多假设才能实现全球覆盖


HTH

有一个不错的项目专门研究OpenStreetMap的连通性——有关详细信息,请参见这些。他们正在统计“路由岛”和重复路径的数量


这个链接显示了。

谢谢,我不知道它的存在。我刚刚注册并将交叉发布。仅供参考:感谢链接-这更符合我的想法。我曾经考虑过商业提供商必须如何衡量他们的统计数据,但我的问题已经有点长了,所以我把它排除在外(我想他们在重新调查时会查看更正,然后从中得出更广泛的统计数据)。对于OSM度量,您谈论的是与劣质数据(例如TIGER/Line)或商业数据(这里我将OS数据归类为商业数据!)进行比较。我认为拓扑错误(如正确的连接)、属性(平均速度)和存在性是我担心的主要潜在错误。几米(甚至100米)的误差问题要小得多,因为我正在计算城市之间的路线距离。在商业网络中,由于单向系统、临街道路、,