Machine learning 谷歌地理编码API内部工作_Machine Learning_Google Api_Gis_Geocoding_Google Geocoder

Machine learning 谷歌地理编码API内部工作

machine-learning google-api gis

Machine learning 谷歌地理编码API内部工作,machine-learning,google-api,gis,geocoding,google-geocoder,Machine Learning,Google Api,Gis,Geocoding,Google Geocoder,我目前正在处理一些大型数据集，这些数据集包含一些基于位置的信息，但缺少创建可视化所需的直接纬度和经度测量为了解决这个问题，我一直在使用地理编码API，这些API需要地址或类似地址的信息作为输入，并提供纬度和经度信息作为输出我从使用API开始。不幸的是，由于地址数据的性质，我的许多查询都失败了，所以我开始使用。GoogleAPI为我提供了更高的成功率，但它是一个付费API，并不理想我意识到，考虑到谷歌拥有的令人难以置信的资源，在合理的时间内构建一个能够与他们的地理编码API相媲美的系统几乎是

我目前正在处理一些大型数据集，这些数据集包含一些基于位置的信息，但缺少创建可视化所需的直接纬度和经度测量

为了解决这个问题，我一直在使用地理编码API，这些API需要地址或类似地址的信息作为输入，并提供纬度和经度信息作为输出

我从使用API开始。不幸的是，由于地址数据的性质，我的许多查询都失败了，所以我开始使用。GoogleAPI为我提供了更高的成功率，但它是一个付费API，并不理想

我意识到，考虑到谷歌拥有的令人难以置信的资源，在合理的时间内构建一个能够与他们的地理编码API相媲美的系统几乎是不可能的，但这让我想知道在幕后到底发生了什么

一个类似伯特的翻译系统在起作用吗？文本发送后会发生什么情况？

我通过创建一个索引和一个反向索引，使用n-gram进行类似的使用。看到这个包裹了吗

导入ngram
...
country=filename.replace（'.csv'，''）
ind[country]=ngram.ngram（）
inv[国家]={}
s_csv=csv.reader（流，分隔符=“；”）
下一步（s_csv）
对于s_csv中的行：
坐标=元组（映射（浮点，行[0:2]））
ad=''.join（第[2:]）.lower（）行
ind[国家]。添加（ad）
投资[国家][广告]=（合作伙伴，地址）

然后可以使用

find

功能

对于法国和OSM这样的国家，请注意内存消耗~16GB RAM

要了解这一点的实现，请检查此

我无法找到使用BERT in the Place Search或地理编码API的谷歌公开引用，也无法找到关于“文本发送后会发生什么”的任何内容，真的。然而，考虑到谷歌在搜索方面的历史，他们不太可能应用他们的文本搜索技术（伯特或其他）来纠正拼写错误，或以其他方式调整输入查询以识别同义词等，这可以解释较高的命中率。