Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/asp.net-mvc-3/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hive 配置单元备份和恢复_Hive_Backup_Cloudera_Hortonworks Dataflow - Fatal编程技术网

Hive 配置单元备份和恢复

Hive 配置单元备份和恢复,hive,backup,cloudera,hortonworks-dataflow,Hive,Backup,Cloudera,Hortonworks Dataflow,我想每月/每季度同时备份1000多个表的配置单元元数据和配置单元数据,并提供轻松恢复功能。到目前为止,我找到了以下选项,但不确定哪种选项最适合在生产环境中备份配置单元表。有什么建议吗 阿帕奇猎鹰- 优点:在Ambari中作为服务轻松提供,便于安装 反对:没有社区支持 Hortonworks数据流- 赞成:最新 缺点:没有太多的文档需要测试。请共享有关如何使用Hortonworks数据流进行备份的任何资源 其他方法-使用Distcp的配置单元数据备份、导出/导入、快照和使用关系数据库转储的

我想每月/每季度同时备份1000多个表的配置单元元数据和配置单元数据,并提供轻松恢复功能。到目前为止,我找到了以下选项,但不确定哪种选项最适合在生产环境中备份配置单元表。有什么建议吗

  • 阿帕奇猎鹰-
    • 优点:在Ambari中作为服务轻松提供,便于安装
    • 反对:没有社区支持
  • Hortonworks数据流-
    • 赞成:最新
    • 缺点:没有太多的文档需要测试。请共享有关如何使用Hortonworks数据流进行备份的任何资源
  • 其他方法-使用Distcp的配置单元数据备份、导出/导入、快照和使用关系数据库转储的配置单元元数据备份
    • 缺点:不确定是否同时备份了配置单元数据和配置单元元数据。实施月度/季度计划所需的时间

    对于第三个选项,配置单元元数据通常不需要任何时间。使用distcp:size和数据的分区/分布方式是“耗时”的主要因素@Bilal谢谢。我知道获取元数据转储会更容易。规则。大小和分区—1000个表,有些按列年分区,有些按时间戳分区。您是否有同时实现元数据备份和配置单元数据备份的计划程序示例?可能备份必须以压缩格式存储以便于检索。您好,不客气,很抱歉,我现在没有任何示例可供共享,而且我没有尝试任何压缩格式,否则这听起来是一个很好的解决方案