Geolocation 原始geoip数据来自哪里?
Geolocation 原始geoip数据来自哪里?,geolocation,Geolocation,这个问题是一个更具体问题的一般版本。然而,这些答案无法使用
问题: geoIP数据的原始来源是什么
许多网站会告诉我我的IP在哪里,但它们似乎都在使用不到5家公司的数据库(大多数使用的是MaxMind的数据库)。这些公司提供有限的免费数据库版本,但我正试图确定他们使用的源数据是什么
我尝试过使用Linux/Unix命令,如ping、traceroute、dig、whois等,但它们不能提供可预测的准确信息
序言:我认为这实际上是一个非常有效的问题,因为了解这些东西是如何工作的对于理解这些数据集
这个问题是一个更具体问题的一般版本。然而,这些答案无法使用
问题: geoIP数据的原始来源是什么
许多网站会告诉我我的IP在哪里,但它们似乎都在使用不到5家公司的数据库(大多数使用的是MaxMind的数据库)。这些公司提供有限的免费数据库版本,但我正试图确定他们使用的源数据是什么
- 我尝试过使用Linux/Unix命令,如ping、traceroute、dig、whois等,但它们不能提供可预测的准确信息
序言:我认为这实际上是一个非常有效的问题,因为了解这些东西是如何工作的对于理解这些数据集如何在软件中使用很重要。然而,这个问题的答案相当复杂,充满了历史性的评论
首先,值得一提的是,没有统一的原始geoip数据。这样的事情根本不存在。第二,这方面的数据来自多种资源,通常不可靠和/或过时
要了解互联网是如何产生的,我们需要知道互联网是如何产生并在全世界传播的。简要总结如下:
IANA是一个全球[非营利]组织,负责管理IP块分配给区域组织:这是根据请求进行的,区域组织请求指定的块大小
区域组织可以直接将这些IP块分配给ISP,也可以分配给国家级的子组织(然后由国家级的子组织分配给ISP)
ISP将IP地址分配给本地分支机构等
从上面你可以很容易地看到:
没有一个机构负责向这个或那个位置分配IP块
如何(以及是否)发布关于哪个IP属于哪个位置的信息的决策并不是统一的,而是每个组织决定如何(以及是否)发布该信息
所有这些都造成了一大堆混乱。获取、汇总和排序这些数据需要花费大量精力和很长时间。这就是为什么大多数最新和详细的geoip数据集
无论谁在构建自己的数据集方面遇到挑战,都应该能够直接从最终用户(ISP)处获得此信息,因为更高级别的组织不知道每个IP地址将分配到哪个位置。更高级别的组织只在申请者之间分配IP块(并为更快的处理保留一些空间),由最低级别的组织决定哪个位置获得哪个IP地址,他们没有义务公开发布此信息
UPD:
要开始构建您自己的数据集,您可以从序言开始:我相信这实际上是一个非常有效的问题,因为了解这些东西是如何工作的对于理解这些数据集如何在软件中使用很重要。然而,这个问题的答案相当复杂,充满了历史性的评论
首先,值得一提的是,没有统一的原始geoip数据。这样的事情根本不存在。第二,这方面的数据来自多种资源,通常不可靠和/或过时
要了解互联网是如何产生的,我们需要知道互联网是如何产生并在全世界传播的。简要总结如下:
IANA是一个全球[非营利]组织,负责管理IP块分配给区域组织:这是根据请求进行的,区域组织请求指定的块大小
区域组织可以直接将这些IP块分配给ISP,也可以分配给国家级的子组织(然后由国家级的子组织分配给ISP)
ISP将IP地址分配给本地分支机构等
从上面你可以很容易地看到:
没有一个机构负责向这个或那个位置分配IP块
如何(以及是否)发布关于哪个IP属于哪个位置的信息的决策并不是统一的,而是每个组织决定如何(以及是否)发布该信息
所有这些都造成了一大堆混乱。获取、汇总和排序这些数据需要花费大量精力和很长时间。这就是为什么大多数最新和详细的geoip数据集
无论谁在构建自己的数据集方面遇到挑战,都应该能够直接从最终用户(ISP)处获得此信息,因为更高级别的组织不知道每个IP地址将分配到哪个位置。更高级别的组织只在申请者之间分配IP块(并为更快的处理保留一些空间),由最低级别的组织决定哪个位置获得哪个IP地址,他们没有义务公开发布此信息
UPD:
要开始构建您自己的数据集,您可以从@JBH JFYI开始—数据集有免费版本,但有些过时,而且不是100%可靠。因此,您也不必自己构建自己的geoip数据库。@JBH JFYI-数据集有免费版本,但有些过时,而且不是100%可靠。因此,您也不必自己构建自己的geoipdb。