Geolocation 场馆和其他地理位置的实体解析
假设我想建立一个登记聚合器,统计跨平台的访问量,这样我就可以知道某个地方有多少人在Foursquare、Gowalla、BrightKite登记,等。是否有一个好的库或一套工具,我可以使用开箱即用,将每次服务中的场馆条目与我自己的唯一地点标识符关联起来 我基本上想要一个函数,它可以从一对(placename、address、lat/long)元组映射到[0,1]置信度,即它们引用相同的真实位置Geolocation 场馆和其他地理位置的实体解析,geolocation,geocoding,geotagging,foursquare,entityresolver,Geolocation,Geocoding,Geotagging,Foursquare,Entityresolver,假设我想建立一个登记聚合器,统计跨平台的访问量,这样我就可以知道某个地方有多少人在Foursquare、Gowalla、BrightKite登记,等。是否有一个好的库或一套工具,我可以使用开箱即用,将每次服务中的场馆条目与我自己的唯一地点标识符关联起来 我基本上想要一个函数,它可以从一对(placename、address、lat/long)元组映射到[0,1]置信度,即它们引用相同的真实位置 一定有人已经这么做了,但我的google fu很弱。是的,你可以使用提交这两个地址(假设你是.Net开
一定有人已经这么做了,但我的google fu很弱。是的,你可以使用提交这两个地址(假设你是.Net开发人员,你没有说)。它为地址验证和地理编码提供了一个通用接口,因此你可以合理地确定一个地址等于另一个地址
如果你不能让他们标准化和匹配,你可以比较他们的距离,如果他们之间的距离低于某个阈值,你可以假设他们是同一个地方。我不相信已经有这样的工具可以使用 基于实体解析文献匹配对的一个好方法是
- 获取地名,定义并在其上使用良好的距离函数(例如编辑距离)
- 获取地址,标准化(例如使用提到的geocoder.net工具),并定义它们之间的距离
- 获取坐标并获取距离(这很容易:有很多库和工具用于地理距离计算,这似乎是一个很好的度量)
- 将距离转换为概率(“如果我们假设这些位置相同,那么这种距离的概率是多少”)(不简单)
- 并结合概率(也不简单)