Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/amazon-s3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon s3 雪花-加载数据从云存储加载数据_Amazon S3_Snowflake Cloud Data Platform - Fatal编程技术网

Amazon s3 雪花-加载数据从云存储加载数据

Amazon s3 雪花-加载数据从云存储加载数据,amazon-s3,snowflake-cloud-data-platform,Amazon S3,Snowflake Cloud Data Platform,我有一些数据存储在S3存储桶中,我想将其加载到我的雪花数据库中。请您帮助我更好地理解以下两点: 从文档()中,我看到最好先创建一个外部阶段,然后再将带有副本的数据加载到操作中,但这不是强制性的。 ==>创建此外部步骤的优点/用途是什么?如果不创建,在引擎盖下会发生什么 ==>在复制到文档中,据说数据必须提前暂存。如果数据未暂存,雪花会创建临时暂存吗 如果我的S3存储桶与雪花数据库不在同一区域,是否仍然可以直接加载数据,或者必须首先将数据传输到雪花数据库所在区域的另一个S3存储桶? 我希望这仍然

我有一些数据存储在S3存储桶中,我想将其加载到我的雪花数据库中。请您帮助我更好地理解以下两点:

  • 从文档()中,我看到最好先创建一个外部阶段,然后再将带有副本的数据加载到操作中,但这不是强制性的。 ==>创建此外部步骤的优点/用途是什么?如果不创建,在引擎盖下会发生什么 ==>在复制到文档中,据说数据必须提前暂存。如果数据未暂存,雪花会创建临时暂存吗

  • 如果我的S3存储桶与雪花数据库不在同一区域,是否仍然可以直接加载数据,或者必须首先将数据传输到雪花数据库所在区域的另一个S3存储桶? 我希望这仍然是可能的,但由于网络传输时间的原因,速度会变慢

  • 提前谢谢

  • 创建外部stage的主要优点是能够将文件格式直接绑定到stage,而不必担心在每个
    复制到
    语句时定义它。您还可以绑定包含所有安全信息的连接对象,以使其对用户透明。最后,如果您有大量引用stage的代码,但最终移动了bucket,则不需要更新任何代码。这对于开发人员促进迁移也很好

  • 雪花可以从任何S3铲斗装载,而不考虑区域。它可能会稍微慢一点,但不会比您将其复制到另一个存储桶然后装载到Snowflake的速度慢。请注意,您可能会因为跨区域移动数据而招致AWS的一些出口费用

  • 创建外部stage的主要优点是能够将文件格式直接绑定到stage,而不必担心在每个
    复制到
    语句时定义它。您还可以绑定包含所有安全信息的连接对象,以使其对用户透明。最后,如果您有大量引用stage的代码,但最终移动了bucket,则不需要更新任何代码。这对于开发人员促进迁移也很好

  • 雪花可以从任何S3铲斗装载,而不考虑区域。它可能会稍微慢一点,但不会比您将其复制到另一个存储桶然后装载到Snowflake的速度慢。请注意,您可能会因为跨区域移动数据而招致AWS的一些出口费用


  • 1.这不是强制性的,但如果您想定期进行批量装载,建议您这样做。如果是一次性加载,请参见此处如何直接加载。2.也不是强制性的,但由于网络流量的原因,速度可能会变慢。通常,在Snowflake加载数据之前,必须先暂存数据(您也可以通过WebUI加载小文件)。雪花自动为每个用户创建一个“用户阶段”,为每个表创建一个“表阶段”;将数据复制到这些阶段,然后允许将其加载到雪花表中(用户阶段加载到任何表,表格阶段仅加载到关联表)。用户可以创建命名的阶段,这些阶段可以是内部的,也可以是外部的:内部显然位于您的Snowflake帐户中;外部指向受支持的云位置(S3、Azure、谷歌云存储)@NickW这不是真的。我相信问题是创造舞台对象的好处是什么。从S3存储桶加载数据不需要定义外部阶段。您可以直接引用S3存储桶,在不使用stage对象的情况下加载数据。@MikeWalton感谢您的更正-知道我什么时候错了总是很有用的!你的答案相当全面(与我的答案相比准确)——我能想到的舞台的另一个显著优势是你可以直接查询它。我不相信在不创建阶段(或外部表)的情况下可以查询外部文件。这不是强制性的,但如果您想定期进行批量装载,建议您这样做。如果是一次性加载,请参见此处如何直接加载。2.也不是强制性的,但由于网络流量的原因,速度可能会变慢。通常,在Snowflake加载数据之前,必须先暂存数据(您也可以通过WebUI加载小文件)。雪花自动为每个用户创建一个“用户阶段”,为每个表创建一个“表阶段”;将数据复制到这些阶段,然后允许将其加载到雪花表中(用户阶段加载到任何表,表格阶段仅加载到关联表)。用户可以创建命名的阶段,这些阶段可以是内部的,也可以是外部的:内部显然位于您的Snowflake帐户中;外部指向受支持的云位置(S3、Azure、谷歌云存储)@NickW这不是真的。我相信问题是创造舞台对象的好处是什么。从S3存储桶加载数据不需要定义外部阶段。您可以直接引用S3存储桶,在不使用stage对象的情况下加载数据。@MikeWalton感谢您的更正-知道我什么时候错了总是很有用的!你的答案相当全面(与我的答案相比准确)——我能想到的舞台的另一个显著优势是你可以直接查询它。我不相信你可以在不创建后台(或外部表)的情况下查询外部文件?谢谢各位的回答!谢谢各位的回答!