Cluster computing 在同时引导两台计算机时,PC在主节点中启动故障转移资源之前不会停止伙伴节点中的故障转移资源

Cluster computing 在同时引导两台计算机时,PC在主节点中启动故障转移资源之前不会停止伙伴节点中的故障转移资源,cluster-computing,high-availability,failover,pacemaker,corosync,Cluster Computing,High Availability,Failover,Pacemaker,Corosync,我最近开始研究集群,如果你想了解更多信息,请告诉我 我有一个活动HA群集。它被设计为在故障转移场景中工作 我将节点1和节点2作为活动群集。起搏器和corosync用作群集管理器。两个节点都有1个资源组,每个资源组有3个资源 当Node1停机时,Node2将按预期接管其资源。当Node1重新联机时,PC首先停止node2中的Node1资源,然后在Node1中启动它们,这也是预期的,并且工作正常 问题: 当两个节点同时启动时,我面临问题 情景: 当两个节点都关闭电源,然后同时打开电源时。假设Node

我最近开始研究集群,如果你想了解更多信息,请告诉我

我有一个活动HA群集。它被设计为在故障转移场景中工作

我将节点1和节点2作为活动群集。起搏器和corosync用作群集管理器。两个节点都有1个资源组,每个资源组有3个资源

当Node1停机时,Node2将按预期接管其资源。当Node1重新联机时,PC首先停止node2中的Node1资源,然后在Node1中启动它们,这也是预期的,并且工作正常

问题: 当两个节点同时启动时,我面临问题

情景: 当两个节点都关闭电源,然后同时打开电源时。假设Node2首先启动,然后PCS看到node1仍处于脱机状态(仍在启动),并在Node2中启动node1资源。然后它也在Node2中启动自己的资源

所以在node1完全启动的同时,它会启动自己的资源。这里的问题是在它启动之前,没有停止node2中当前启动的node1资源(故障切换)

因此,在结束时,node1的资源在node1中启动,node2的node1和node2资源也在node2中启动

当它们以时差(15分钟)启动时,上述场景从未发生。当只有一个节点重新启动或断电时,它也可以正常工作

            # pcs property list --all
            Cluster Properties:
            batch-limit: 0
            cluster-delay: 60s
            cluster-infrastructure: cman
            cluster-recheck-interval: 15min
            crmd-finalization-timeout: 30min
            crmd-integration-timeout: 3min
            crmd-transition-delay: 0s
            dc-deadtime: 20s
            dc-version: 1.1.11-97629de
            default-action-timeout: 20s
            default-resource-stickiness: 0
            election-timeout: 2min
            enable-startup-probes: true
            expected-quorum-votes: 2
            is-managed-default: true
            last-lrm-refresh: 1565098302
            load-threshold: 80%
            maintenance-mode: false
            migration-limit: -1
            no-quorum-policy: ignore
            node-action-limit: 0
            node-health-green: 0
            node-health-red: -INFINITY
            node-health-strategy: none
            node-health-yellow: 0
            pe-error-series-max: -1
            pe-input-series-max: 4000
            pe-warn-series-max: 5000
            placement-strategy: default
            remove-after-stop: false
            shutdown-escalation: 20min
            start-failure-is-fatal: true
            startup-fencing: true
            stonith-action: reboot
            stonith-enabled: false
            stonith-timeout: 60s
            stop-all-resources: false
            stop-orphan-actions: true
            stop-orphan-resources: true
            symmetric-cluster: false

我能够通过使用pcs 0.9.155版本解决此问题。
旧版本的PC在同时重新启动时出现此错误。

我可以使用PC 0.9.155版本解决此问题。 旧版本的PC在同时重新启动时出现此错误