Geolocation 场馆和其他地理位置的实体解析

Geolocation 场馆和其他地理位置的实体解析,geolocation,geocoding,geotagging,foursquare,entityresolver,Geolocation,Geocoding,Geotagging,Foursquare,Entityresolver,假设我想建立一个登记聚合器,统计跨平台的访问量,这样我就可以知道某个地方有多少人在Foursquare、Gowalla、BrightKite登记,等。是否有一个好的库或一套工具,我可以使用开箱即用,将每次服务中的场馆条目与我自己的唯一地点标识符关联起来 我基本上想要一个函数,它可以从一对(placename、address、lat/long)元组映射到[0,1]置信度,即它们引用相同的真实位置 一定有人已经这么做了,但我的google fu很弱。是的,你可以使用提交这两个地址(假设你是.Net开

假设我想建立一个登记聚合器,统计跨平台的访问量,这样我就可以知道某个地方有多少人在Foursquare、Gowalla、BrightKite登记,等。是否有一个好的库或一套工具,我可以使用开箱即用,将每次服务中的场馆条目与我自己的唯一地点标识符关联起来

我基本上想要一个函数,它可以从一对(placename、address、lat/long)元组映射到[0,1]置信度,即它们引用相同的真实位置


一定有人已经这么做了,但我的google fu很弱。

是的,你可以使用提交这两个地址(假设你是.Net开发人员,你没有说)。它为地址验证和地理编码提供了一个通用接口,因此你可以合理地确定一个地址等于另一个地址


如果你不能让他们标准化和匹配,你可以比较他们的距离,如果他们之间的距离低于某个阈值,你可以假设他们是同一个地方。

我不相信已经有这样的工具可以使用

基于实体解析文献匹配对的一个好方法是

  • 获取地名,定义并在其上使用良好的距离函数(例如编辑距离)
  • 获取地址,标准化(例如使用提到的geocoder.net工具),并定义它们之间的距离
  • 获取坐标并获取距离(这很容易:有很多库和工具用于地理距离计算,这似乎是一个很好的度量)
  • 将距离转换为概率(“如果我们假设这些位置相同,那么这种距离的概率是多少”)(不简单)
  • 并结合概率(也不简单)
然后,一个类似闭包的算法(根据给定概率treshold之上的合并对关闭集合)也可能有助于找到所有匹配项(例如,当给定场地累积不同的名称时)

然而,这不是一个坏的工具或服务