Hive 将配置单元表迁移到红移

Hive 将配置单元表迁移到红移,hive,amazon-redshift,data-migration,Hive,Amazon Redshift,Data Migration,让我稍微解释一下情况: 我在S3(ORC,拼花地板)上存储了数百个蜂巢桌,所以我要明确的是,没有HDF。 现在,我感兴趣的是将其中一些迁移到Redshift以运行一些性能测试。 我知道redshift不支持ORC,Parquet,所以我需要创建一些CSV/JSON来使用COPY命令。 我正在考虑使用Hive本身创建临时CSV表,然后迁移到Redshift。我也在考虑使用Spark来移动这些数据。 有这种情况经验的人吗?有一种简单的方法可以将数据迁移到红移中。所以首先需要将拼花地板或orc加载到S

让我稍微解释一下情况: 我在S3(ORC,拼花地板)上存储了数百个蜂巢桌,所以我要明确的是,没有HDF。 现在,我感兴趣的是将其中一些迁移到Redshift以运行一些性能测试。 我知道redshift不支持ORC,Parquet,所以我需要创建一些CSV/JSON来使用COPY命令。 我正在考虑使用Hive本身创建临时CSV表,然后迁移到Redshift。我也在考虑使用Spark来移动这些数据。
有这种情况经验的人吗?

有一种简单的方法可以将数据迁移到红移中。所以首先需要将拼花地板或orc加载到Spark(pyspark、java或scala)中,然后可以使用databricks包直接将这些数据插入到redshift中。下面是databricks包的链接,其中包括一些示例


有一种简单的方法可以将数据迁移到红移。所以首先需要将拼花地板或orc加载到Spark(pyspark、java或scala)中,然后可以使用databricks包直接将这些数据插入到redshift中。下面是databricks包的链接,其中包括一些示例


您可以设置红移光谱,使S3表看起来像红移表,然后您可以直接查询数据或将其引入内部红移表。

ORC和拼花地板完全受支撑。

您可以设置红移光谱,使S3表看起来像红移表,然后您可以直接查询数据或将其引入内部红移表。

ORC和拼花地板完全受支撑。

我尝试了这个选项,红移数据块包工作得很好。我尝试了这个选项,红移数据块包工作得很好