Machine learning 谷歌地理编码API内部工作

Machine learning 谷歌地理编码API内部工作,machine-learning,google-api,gis,geocoding,google-geocoder,Machine Learning,Google Api,Gis,Geocoding,Google Geocoder,我目前正在处理一些大型数据集,这些数据集包含一些基于位置的信息,但缺少创建可视化所需的直接纬度和经度测量 为了解决这个问题,我一直在使用地理编码API,这些API需要地址或类似地址的信息作为输入,并提供纬度和经度信息作为输出 我从使用API开始。不幸的是,由于地址数据的性质,我的许多查询都失败了,所以我开始使用。GoogleAPI为我提供了更高的成功率,但它是一个付费API,并不理想 我意识到,考虑到谷歌拥有的令人难以置信的资源,在合理的时间内构建一个能够与他们的地理编码API相媲美的系统几乎是

我目前正在处理一些大型数据集,这些数据集包含一些基于位置的信息,但缺少创建可视化所需的直接纬度和经度测量

为了解决这个问题,我一直在使用地理编码API,这些API需要地址或类似地址的信息作为输入,并提供纬度和经度信息作为输出

我从使用API开始。不幸的是,由于地址数据的性质,我的许多查询都失败了,所以我开始使用。GoogleAPI为我提供了更高的成功率,但它是一个付费API,并不理想

我意识到,考虑到谷歌拥有的令人难以置信的资源,在合理的时间内构建一个能够与他们的地理编码API相媲美的系统几乎是不可能的,但这让我想知道在幕后到底发生了什么


一个类似伯特的翻译系统在起作用吗?文本发送后会发生什么情况?

我通过创建一个索引和一个反向索引,使用n-gram进行类似的使用。看到这个包裹了吗

导入ngram
...
country=filename.replace('.csv','')
ind[country]=ngram.ngram()
inv[国家]={}
s_csv=csv.reader(流,分隔符=“;”)
下一步(s_csv)
对于s_csv中的行:
坐标=元组(映射(浮点,行[0:2]))
ad=''.join(第[2:]).lower()行
ind[国家]。添加(ad)
投资[国家][广告]=(合作伙伴,地址)
然后可以使用
find
功能

对于法国和OSM这样的国家,请注意内存消耗~16GB RAM


要了解这一点的实现,请检查此

我无法找到使用BERT in the Place Search或地理编码API的谷歌公开引用,也无法找到关于“文本发送后会发生什么”的任何内容,真的。然而,考虑到谷歌在搜索方面的历史,他们不太可能应用他们的文本搜索技术(伯特或其他)来纠正拼写错误,或以其他方式调整输入查询以识别同义词等,这可以解释较高的命中率。