Couchbase 3.1：机架感知、副本和自动故障切换行为_Couchbase_High Availability

Couchbase 3.1：机架感知、副本和自动故障切换行为

couchbase

Couchbase 3.1：机架感知、副本和自动故障切换行为,couchbase,high-availability,Couchbase,High Availability,我对Couchbase（3.1）的RAZ+副本+自动故障切换行为有疑问我想模拟以下配置和灾难场景： 2个节点位于VMWare VCenter提供的vm平台上（模拟couchbase群集的第一部分成员来自主生产区）。及 3个节点位于RHEV提供的vm平台上（基于KVM）（模拟couchbase集群的第二部分成员来自同一数据中心的二级产品区）所有这5个节点都安装了相同的操作系统和相同版本的couchbase（3.1）位。并配置为一个集群，在第一轮测试中创建了一个bucket，replica=2

我对Couchbase（3.1）的RAZ+副本+自动故障切换行为有疑问

我想模拟以下配置和灾难场景：

2个节点位于VMWare VCenter提供的vm平台上（模拟couchbase群集的第一部分成员来自主生产区）。及 3个节点位于RHEV提供的vm平台上（基于KVM）（模拟couchbase集群的第二部分成员来自同一数据中心的二级产品区）

所有这5个节点都安装了相同的操作系统和相同版本的couchbase（3.1）位。并配置为一个集群，在第一轮测试中创建了一个bucket，replica=2，之后将该bucket更改为3。已启用“自动故障切换”设置

假设二级生产区（由RHEV平台提供）中的三个节点同时崩溃（模拟二级区域完全失败，例如整个RHEV平台因断电而崩溃）

将对集群可用性的损害降至最低并减少对连接/操作couchbase集群的应用程序的影响的最佳方式是什么（r/w操作）

对于此3节点崩溃场景，充分利用机架感知、微调副本编号和正确操作步骤的最佳组合是什么

顺便说一句：假设在执行故障转移（或自动故障转移）时没有容量/负载问题，也就是级联故障

谢谢

如果您要将RZA与您所说的两个虚拟机监控程序一起使用，我会使用等量的RZA。每个HV上有3个节点，HV#1上的所有节点都在服务器组#1中，HV#2上的所有节点都在服务器组#2中。不过，您只需要一个副本。对于您提到的故障场景，当整个HV发生故障时，拥有多个复制副本对您毫无帮助。在运行RZA时，如我所述，SG#1中节点的所有副本都在SG#2中的节点上，反之亦然。希望这是有道理的

此外，我们正在讨论的配置中的RZA是生产中仅限企业使用的功能，因此这意味着您已经为其付费（生产中超过2个节点的任何设备都必须获得许可）。我只提到这一点，因为这些东西可以带给您的Couchbase客户经理或技术支持团队，以获得此帮助和其他更详细的帮助