Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop 备份配置单元表的最佳做法_Hadoop_Hive - Fatal编程技术网

Hadoop 备份配置单元表的最佳做法

Hadoop 备份配置单元表的最佳做法,hadoop,hive,Hadoop,Hive,我们的业务数据位于配置单元表中。配置单元表是按年份\周进行分区的。最近我们遇到了一个问题,所有周分区数据都丢失(我们不确定如何丢失),并且配置单元表没有备份。现在,我们正在寻找备份配置单元表的最佳做法 参见Cloudera BDR(许可)和HortonWorks已建立>>快照HDFS目录存储配置单元数据集的任何类似工具;通过API或直接通过底层DB本机备份工具备份元存储;将HDFS文件(从稳定快照)复制到另一个DR群集,或复制到云存储;发布快照。还有一个针对Hadoop(和Cassandra)的

我们的业务数据位于配置单元表中。配置单元表是按年份\周进行分区的。最近我们遇到了一个问题,所有周分区数据都丢失(我们不确定如何丢失),并且配置单元表没有备份。现在,我们正在寻找备份配置单元表的最佳做法

参见Cloudera BDR(许可)和HortonWorks已建立>>快照HDFS目录存储配置单元数据集的任何类似工具;通过API或直接通过底层DB本机备份工具备份元存储;将HDFS文件(从稳定快照)复制到另一个DR群集,或复制到云存储;发布快照。还有一个针对Hadoop(和Cassandra)的商业备份解决方案,尽管我记不起它们的新名称(也记不起旧名称)。@roh,replication=redundancy意味着高可用性;备份意味着能够从灾难中恢复(建筑物被淹、云提供商因俄罗斯攻击而停机、服务器因勒索软件而停机、数据因“胖手指”维护而丢失等),即使RPO/RTO意味着延迟、成本和一些数据丢失。那完全不同。墨菲定律断言,删除的分区将“跳过垃圾”,因为垃圾就是这样发生的。你是对的@Samson Scharfrichter。谢谢你还需要备份你的元存储。。。不仅是HDFS数据。从Oozie或其他调度器运行导出