Hive 如何在配置单元中的分区表之间移动数据

Hive 如何在配置单元中的分区表之间移动数据,hive,partitioning,Hive,Partitioning,我有两个表emp1和emp2,其中包含字段- 用户ID 名字 职业 国家 emp1按国家划分,而emp2按职业划分 如何将数据从emp1移动到emp2用emp1中的数据集加上emp2表中的旧数据(union all)覆盖目标表。注意:查询结束时,Distribut by——这是为了优化分区创建,最终的还原程序将只接收其分区数据,这将减少内存消耗 insert overwrite table emp2 partition(occupation) select userid, name, co

我有两个表
emp1
emp2
,其中包含字段-

  • 用户ID
  • 名字
  • 职业
  • 国家
emp1
按国家划分,而
emp2
按职业划分


如何将数据从
emp1
移动到
emp2
用emp1中的数据集加上emp2表中的旧数据(
union all
)覆盖目标表。注意:查询结束时,Distribut by——这是为了优化分区创建,最终的还原程序将只接收其分区数据,这将减少内存消耗

insert overwrite table emp2 partition(occupation) 
select userid, name, country, occupation from emp1 
union all
select userid, name, country, occupation from emp2
distribute by occupation;

此外,您可以使用row_number()添加或删除重复项。

仅代码答案本身并不是很有用。如果您可以添加一些详细信息,解释它如何/为什么回答该问题,这将有所帮助。请编辑您的答案并进行解释,或者如果您无法解释代码,请提供有用的链接。你应该避免以满足“请给我代码”问题的方式发布答案。