Indexing 谷歌如何存储索引?

Indexing 谷歌如何存储索引?,indexing,Indexing,最近我一直在读关于网络爬网、索引和服务的文章。我发现了一些关于谷歌抓取网页和服务搜索过程的信息。 我想知道的是他们是如何保存所有这些索引的?我的意思是,要储存的东西很多,对吧?他们是怎么做到的 谢谢我回答我自己,因为我发现了一些关于谷歌索引的有趣内容: 在谷歌网站管理员YouTube频道,Matt Cutts向我们介绍了谷歌索引背后的架构: 在我看来,值得一读的参考文献之一是: 这有助于我更好地理解它,我希望它也能帮助你 根据信息的类型,他们使用各种不同类型的数据存储。通常,他们不使用SQL

最近我一直在读关于网络爬网、索引和服务的文章。我发现了一些关于谷歌抓取网页和服务搜索过程的信息。 我想知道的是他们是如何保存所有这些索引的?我的意思是,要储存的东西很多,对吧?他们是怎么做到的


谢谢

我回答我自己,因为我发现了一些关于谷歌索引的有趣内容:

  • 在谷歌网站管理员YouTube频道,Matt Cutts向我们介绍了谷歌索引背后的架构:
  • 在我看来,值得一读的参考文献之一是:

这有助于我更好地理解它,我希望它也能帮助你

根据信息的类型,他们使用各种不同类型的数据存储。通常,他们不使用SQL,因为它有太多的开销,并且与大规模的信息分发不太兼容


谷歌实际上开发了自己的数据存储,用于大型的读取应用程序,如谷歌地球和搜索引擎的缓存。这支持在大量计算机上分发信息,每一条信息存储在三台或四台不同的计算机上。这使得他们可以使用廉价的硬件——如果一台计算机出现故障,其他计算机会立即开始将其保存的所有数据恢复到适当数量的副本中

数据中心:嗨,Alex。谢谢你的评论。我想知道如何在数据库中存储所有这些索引?他们用的是哪种引擎?开个玩笑,这个问题有点像可口可乐的收入是多少?谷歌?听起来像是内部开发的:@Alex Reynolds:谢谢你的链接。这很有帮助:)。