Cluster computing 起搏器corosync服务被忽略

Cluster computing 起搏器corosync服务被忽略,cluster-computing,pacemaker,Cluster Computing,Pacemaker,两节点群集节点A、节点B 在节点A上运行的服务X,节点B是DC 我们正在使用带起搏器的stack corosync。 故障超时时间为10秒。 目标角色已启动 事情就是这样发生的 节点A向节点B发送事件服务X关闭 节点B打印忽略服务X的过期故障 在此之后,群集永远不会重新启动服务X 现在的问题是: 为什么节点B(DC)会忽略过期的故障 即使此时DC被忽略,但当服务X关闭时,节点A也应监视该服务,并再次向节点B发送故障状态,此时节点B应重新启动该服务。为什么这不可能 您可以将以下属性添加到crm配置

两节点群集节点A、节点B

在节点A上运行的服务X,节点B是DC

我们正在使用带起搏器的stack corosync。 故障超时时间为10秒。 目标角色已启动

事情就是这样发生的 节点A向节点B发送事件服务X关闭 节点B打印忽略服务X的过期故障 在此之后,群集永远不会重新启动服务X

现在的问题是:

  • 为什么节点B(DC)会忽略过期的故障
  • 即使此时DC被忽略,但当服务X关闭时,节点A也应监视该服务,并再次向节点B发送故障状态,此时节点B应重新启动该服务。为什么这不可能

  • 您可以将以下属性添加到crm配置中,该配置将尝试启动失败的过期资源

     start-failure-is-fatal="false"
    

    其中一个原因可能是两台服务器(DC和其他机器)之间的时间差

    所以,DC认为这是一个古老的事件,忽略它。请同步时间,然后尝试重新创建问题