Postgresql 将orc格式加载到aurora postgres数据库
我们有一个ORC文件格式,存储在s3中,我们希望将这些文件加载到AWS Aurora postgres DB中 我们从互联网上得到的是:Postgresql 将orc格式加载到aurora postgres数据库,postgresql,hadoop,amazon-s3,orc,Postgresql,Hadoop,Amazon S3,Orc,我们有一个ORC文件格式,存储在s3中,我们希望将这些文件加载到AWS Aurora postgres DB中 我们从互联网上得到的是: postgres支持csv、txt和其他格式,而不是ORC INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于','存储为TEXTFILE SELECT*FROM default.foo 有谁能帮我们找到解决方案吗?此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据 因为您的文件是ORC格
INSERT OVERWRITE DIRECTORY''行格式分隔字段终止于','存储为TEXTFILE SELECT*FROM default.foo代码>
有谁能帮我们找到解决方案吗?此日期Aurora上的PostgreSQL仅支持通过复制命令从TXT和CSV文件摄取S3中的数据 因为您的文件是ORC格式的,所以您可以将这些分幅转换为CSV或TXT格式,然后接收数据。使用Athena可以很容易地做到这一点,只需为原始数据创建一个表并运行SELECT*FROM表查询。如页面中所述,这将自动生成包含结果的CSV文件。 这将不是最佳的,因为您不仅要支付转换价格,还要支付两倍的he存储(原始ORC和转换的CSV),但它将允许您非常轻松地转换数据 一个更好的方法是使用像AWS Glue这样的服务,它支持并具有。使用此方法将为您提供一个实际的ETL,即使您现在只需要E(xtract)和L(oad),仍然会为您将来可能需要的任何类型的转换敞开大门
在这篇名为“他们展示了相反的流程”(Aurora->S3通过胶水),但它仍然可以让您了解流程。您需要将数据转换为与Aurora/PostgreSQL兼容的格式。我们没有直接将orc转换为csv或txt的解决方案吗?