Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Postgresql 将orc格式加载到aurora postgres数据库_Postgresql_Hadoop_Amazon S3_Orc - Fatal编程技术网

Postgresql 将orc格式加载到aurora postgres数据库

Postgresql 将orc格式加载到aurora postgres数据库,postgresql,hadoop,amazon-s3,orc,Postgresql,Hadoop,Amazon S3,Orc,我们有一个ORC文件格式,存储在s3中,我们希望将这些文件加载到AWS Aurora postgres DB中 我们从互联网上得到的是: postgres支持csv、txt和其他格式,而不是ORC INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于','存储为TEXTFILE SELECT*FROM default.foo 有谁能帮我们找到解决方案吗?此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据 因为您的文件是ORC格

我们有一个ORC文件格式,存储在s3中,我们希望将这些文件加载到AWS Aurora postgres DB中

我们从互联网上得到的是:

  • postgres支持csv、txt和其他格式,而不是ORC
  • INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于','存储为TEXTFILE SELECT*FROM default.foo

  • 有谁能帮我们找到解决方案吗?

    此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据

    因为您的文件是ORC格式的,所以您可以将这些分幅转换为CSV或TXT格式,然后接收数据。使用Athena可以很容易地做到这一点,只需为原始数据创建一个表并运行SELECT*FROM表查询。如页面中所述,这将自动生成包含结果的CSV文件。 这将不是最佳的,因为您不仅要支付转换价格,还要支付两倍的he存储(原始ORC和转换的CSV),但它将允许您非常轻松地转换数据

    一个更好的方法是使用像AWS Glue这样的服务,它支持并具有。使用此方法将为您提供一个实际的ETL,即使您现在只需要E(xtract)和L(oad),仍然会为您将来可能需要的任何类型的转换敞开大门


    在这篇名为“他们展示了相反的流程”(Aurora->S3通过胶水),但它仍然可以让您了解流程。

    您需要将数据转换为与Aurora/PostgreSQL兼容的格式。我们没有直接将orc转换为csv或txt的解决方案吗?