Hive 如何将分区数据重新加载到ORC中

Hive 如何将分区数据重新加载到ORC中,hive,yarn,azure-hdinsight,Hive,Yarn,Azure Hdinsight,是否有将数据加载到带有分区的ORC的最佳实践。如果我将120 GB的数据加载到ORC分区表中。分区在两列上。如果要为特定分区重新加载数据,请说明如何执行重新加载活动。如何删除分区,就是改变表中的删除分区(分区值)。即使删除了分区,我仍然可以在Hive/WareHouse文件夹中看到ORC分区文件。如何清理未命名的分区文件。若我只想将单个分区的数据加载到delete分区中,那个么该如何执行以及最好的方法是什么 带Bucket分区的Is ORC比带分区的ORC性能更好,然后ORC(无分区)删除表或分

是否有将数据加载到带有分区的ORC的最佳实践。如果我将120 GB的数据加载到ORC分区表中。分区在两列上。如果要为特定分区重新加载数据,请说明如何执行重新加载活动。如何删除分区,就是改变表中的删除分区(分区值)。即使删除了分区,我仍然可以在Hive/WareHouse文件夹中看到ORC分区文件。如何清理未命名的分区文件。若我只想将单个分区的数据加载到delete分区中,那个么该如何执行以及最好的方法是什么


带Bucket分区的Is ORC比带分区的ORC性能更好,然后ORC(无分区)

删除表或分区只会删除元数据信息,但不一定删除外部表的数据。您应该改为使用TRUNCATE删除外部表或分区中的数据。阅读更多