Architecture Instagram等服务如何缓存经常查看的图像

Architecture Instagram等服务如何缓存经常查看的图像,architecture,Architecture,像instagram这样拥有全球用户的服务可能会使用1000个CDN。当一个拥有一百万或更多追随者的用户上传x张图片时,他们是如何缓存的。是将它们推送到所有CDN,还是追随者从中央分布式存储中提取图像,然后在下载文件的过程中缓存到CDN 所以给了我一个关于否决票的警告,如果你想继续否决,但请说明原因。我找不到答案,所以把它贴在这里。如果您知道答案,请帮助他们应该以某种方式平衡成本(存储和传输成本)和可用性。 将每个文件推送到所有位置是没有意义的,因为有可能没有人会请求其中的一些文件。 当您必须以

像instagram这样拥有全球用户的服务可能会使用1000个CDN。当一个拥有一百万或更多追随者的用户上传x张图片时,他们是如何缓存的。是将它们推送到所有CDN,还是追随者从中央分布式存储中提取图像,然后在下载文件的过程中缓存到CDN

所以给了我一个关于否决票的警告,如果你想继续否决,但请说明原因。我找不到答案,所以把它贴在这里。如果您知道答案,请帮助

他们应该以某种方式平衡成本(存储和传输成本)和可用性。 将每个文件推送到所有位置是没有意义的,因为有可能没有人会请求其中的一些文件。 当您必须以任何方式分发中央存储时,保留其备份也是没有意义的。 最有可能的情况是,他们将所有文件推送到至少一个备选地理位置(和数据中心),并以最低的传输费用获得所有文件的至少一个副本,以提供高可用性,同时降低成本。 区分受欢迎和不受欢迎的文件并没有多大意义,因为只有第一个访问者会在后续的拉取中错过请求。 但是,它们可能会在任何通知推送之前推送流行文件的文件,以避免多个用户同时错过请求时出现瓶颈。 其他不太流行的文件应该被删除,以降低存储和传输成本

不要忘记缩略图。 一些社交网络拒绝保留从未请求过的文件,而支持FPGA实时转换