Cloudera 在CDH簇之间复制拼花地板表

Cloudera 在CDH簇之间复制拼花地板表,cloudera,impala,Cloudera,Impala,我需要将拼花地板表从CDH4.5复制到CDH4.3集群,为此: 使用distcp复制包含数据的目录(/user/hive/warehouse/mytable) 比较目录大小 修复了两个集群上看起来相同的权限和所有权(777和impala:hive) 打开黑斑羚壳并创建表 无效元数据无效元数据 刷新的表格refresh mytable 一切正常,但黑斑羚看不到数据。重新启动黑斑羚也没有帮助。是否可以使其查看复制的数据?无论如何,问题是表已分区,在这种情况下,您需要手动重新创建分区: alter

我需要将拼花地板表从CDH4.5复制到CDH4.3集群,为此:

  • 使用distcp复制包含数据的目录(/user/hive/warehouse/mytable)
  • 比较目录大小
  • 修复了两个集群上看起来相同的权限和所有权(777和impala:hive)
  • 打开黑斑羚壳并创建表
  • 无效元数据
    无效元数据
  • 刷新的表格
    refresh mytable

一切正常,但黑斑羚看不到数据。重新启动黑斑羚也没有帮助。是否可以使其查看复制的数据?

无论如何,问题是表已分区,在这种情况下,您需要手动重新创建分区:

alter table mytable add partition(time=12341313131)