Hadoop HBase主程序问题

Hadoop HBase主程序问题,hadoop,hbase,cloudera,hortonworks-data-platform,Hadoop,Hbase,Cloudera,Hortonworks Data Platform,我注意到由于一些正在进行的bug,Hbase MasterProcWALs文件夹已经填满了我的Hdfs。我想知道删除MasterProcWALs文件夹下的文件是否会删除Hbase中的任何数据?主节点使用MasterProcWALs,下面是 HMaster将管理操作及其运行状态(如崩溃服务器的处理、表创建和其他DDL)记录到过程存储中。过程存储WAL存储在masterprocWAL目录下。主WAL与区域服务器WAL不同。保持主WAL允许我们运行一个状态机,该状态机在主故障时具有弹性。例如,如果HM

我注意到由于一些正在进行的bug,Hbase MasterProcWALs文件夹已经填满了我的Hdfs。我想知道删除MasterProcWALs文件夹下的文件是否会删除Hbase中的任何数据?

主节点使用MasterProcWALs,下面是

HMaster将管理操作及其运行状态(如崩溃服务器的处理、表创建和其他DDL)记录到过程存储中。过程存储WAL存储在
masterprocWAL
目录下。主WAL与区域服务器WAL不同。保持主WAL允许我们运行一个状态机,该状态机在主故障时具有弹性。例如,如果HMASTER在创建一个表遇到问题并失败时,下一个活动的HMSTER可以占用先前的左边的位置,并将操作带到完成。自hbase-2.0.0以来,引入了一个新的AssignmentManager(又称AMv2),HMaster处理区域分配操作、服务器崩溃处理、平衡等,所有这些都是通过AMv2持久化所有状态并转换到MasterProcWal,而不是像我们在hbase-1.x中所做的那样升级到ZooKeeper。本节涉及hbase-2.0.0至hbase-2.2.x

因此,MasterProcWal包含永久存储器上的活动HBase主机未应用的DDL过程。如果删除它们并重新启动HBase主机或切换到另一个主机,它将无法读取存储在这些WAL中的过程,这些过程将丢失。主机将在WAL之前的最后一个已知状态下启动。数据在RegionServer级别进行管理,不应受到影响,除非其结构受到WAL中存储的某些过程的影响并丢失

在这样做之前,我会

  • 检查HBase UI的“过程”选项卡中正在进行的操作,它将显示过程和WAL文件。尝试找出问题的根本原因,WAL文件的数量不应随着时间的推移而增加
  • 尝试重新启动主机,检查其日志,因为它将在启动期间读取MasterProcWAL文件
  • 只有在HBase主机启动期间出现阻塞问题时,才删除它们。如果您决定删除它们,请执行备份,请小心操作,并自行承担风险

另请参见。

我们新安装了CDP-DC 7.1.3,并经常收到“此运行状况测试不好,因为服务监视器未找到活动主机。” 从HDFS清洁MasterProcWALs后,工作正常