Postgresql 将orc格式加载到aurora postgres数据库_Postgresql_Hadoop_Amazon S3_Orc

Postgresql 将orc格式加载到aurora postgres数据库

postgresql hadoop amazon-s3

Postgresql 将orc格式加载到aurora postgres数据库,postgresql,hadoop,amazon-s3,orc,Postgresql,Hadoop,Amazon S3,Orc,我们有一个ORC文件格式，存储在s3中，我们希望将这些文件加载到AWS Aurora postgres DB中我们从互联网上得到的是： postgres支持csv、txt和其他格式，而不是ORC INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于'，'存储为TEXTFILE SELECT*FROM default.foo 有谁能帮我们找到解决方案吗？此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据因为您的文件是ORC格

我们有一个ORC文件格式，存储在s3中，我们希望将这些文件加载到AWS Aurora postgres DB中

我们从互联网上得到的是：

postgres支持csv、txt和其他格式，而不是ORC

INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于'，'存储为TEXTFILE SELECT*FROM default.foo


有谁能帮我们找到解决方案吗？
此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据
因为您的文件是ORC格式的，所以您可以将这些分幅转换为CSV或TXT格式，然后接收数据。使用Athena可以很容易地做到这一点，只需为原始数据创建一个表并运行SELECT*FROM表查询。如页面中所述，这将自动生成包含结果的CSV文件。
这将不是最佳的，因为您不仅要支付转换价格，还要支付两倍的he存储（原始ORC和转换的CSV），但它将允许您非常轻松地转换数据
一个更好的方法是使用像AWS Glue这样的服务，它支持并具有。使用此方法将为您提供一个实际的ETL，即使您现在只需要E（xtract）和L（oad），仍然会为您将来可能需要的任何类型的转换敞开大门
在这篇名为“他们展示了相反的流程”（Aurora->S3通过胶水），但它仍然可以让您了解流程。
您需要将数据转换为与Aurora/PostgreSQL兼容的格式。我们没有直接将orc转换为csv或txt的解决方案吗？