Snowflake cloud data platform 什么;“云存储”;是指在雪花数据库存储层?

Snowflake cloud data platform 什么;“云存储”;是指在雪花数据库存储层?,snowflake-cloud-data-platform,snowflake-schema,Snowflake Cloud Data Platform,Snowflake Schema,我只是对多论坛上关于雪花数据库存储的解释感到困惑。当他们说数据以columner和优化文件的形式存储在云存储中时,是指S3 bucket还是azure blob存储?Snowflake是否存储数据或使用云主机存储?数据库存储在S3中的文件中,Azure和GCP存储桶中的Azure Blob(或其他任何名称)中。数据和存储是完全独立的,这与基于服务器的RDBMS(如REDSHIFT)不同,后者的服务器既有计算又有存储。有关更多详细信息,请参见雪花文档。根据论文(2016年)-参见第3.1段数据存储

我只是对多论坛上关于雪花数据库存储的解释感到困惑。当他们说数据以columner和优化文件的形式存储在云存储中时,是指S3 bucket还是azure blob存储?Snowflake是否存储数据或使用云主机存储?

数据库存储在S3中的文件中,Azure和GCP存储桶中的Azure Blob(或其他任何名称)中。数据和存储是完全独立的,这与基于服务器的RDBMS(如REDSHIFT)不同,后者的服务器既有计算又有存储。有关更多详细信息,请参见雪花文档。

根据论文(2016年)-参见第3.1段数据存储:

Snowflake最初选择AmazonS3存储表数据,查询 查询运算符生成的结果和临时数据(例如海量数据) 一旦本地磁盘空间耗尽,以及对于大型查询 结果。元数据,如目录对象,表由哪些对象组成 存储在哪个S3文件、统计信息、锁、事务日志等 一个可扩展的事务性键值存储,它是云的一部分 服务层

从那时起,直到今天,“雪花”还可以在和上运行


因此,在设置雪花帐户时,用户可以选择使用云存储提供商:对于AWS雪花将使用简单存储服务(S3),对于Azure,它将使用Azure Blob存储,对于Google cloud,它将使用Google云存储(GCS).

如果这个答案不清楚:如果您在AWS上设置了雪花实例,那么雪花将使用S3作为数据存储层,Azure->Azure Blob,如果您在GCP上,他们将使用GCS。@SimonDarr我将在我的回答中更清楚地说明这一点。谢谢