Couchbase 3.1:机架感知、副本和自动故障切换行为

Couchbase 3.1:机架感知、副本和自动故障切换行为,couchbase,high-availability,Couchbase,High Availability,我对Couchbase(3.1)的RAZ+副本+自动故障切换行为有疑问 我想模拟以下配置和灾难场景: 2个节点位于VMWare VCenter提供的vm平台上(模拟couchbase群集的第一部分成员来自主生产区)。及 3个节点位于RHEV提供的vm平台上(基于KVM)(模拟couchbase集群的第二部分成员来自同一数据中心的二级产品区) 所有这5个节点都安装了相同的操作系统和相同版本的couchbase(3.1)位。 并配置为一个集群,在第一轮测试中创建了一个bucket,replica=2

我对Couchbase(3.1)的RAZ+副本+自动故障切换行为有疑问

我想模拟以下配置和灾难场景:

2个节点位于VMWare VCenter提供的vm平台上(模拟couchbase群集的第一部分成员来自主生产区)。及 3个节点位于RHEV提供的vm平台上(基于KVM)(模拟couchbase集群的第二部分成员来自同一数据中心的二级产品区)

所有这5个节点都安装了相同的操作系统和相同版本的couchbase(3.1)位。 并配置为一个集群,在第一轮测试中创建了一个bucket,replica=2,之后将该bucket更改为3。已启用“自动故障切换”设置

假设二级生产区(由RHEV平台提供)中的三个节点同时崩溃(模拟二级区域完全失败,例如整个RHEV平台因断电而崩溃)

将对集群可用性的损害降至最低并减少对连接/操作couchbase集群的应用程序的影响的最佳方式是什么(r/w操作)

对于此3节点崩溃场景,充分利用机架感知、微调副本编号和正确操作步骤的最佳组合是什么

顺便说一句:假设在执行故障转移(或自动故障转移)时没有容量/负载问题,也就是级联故障


谢谢

如果您要将RZA与您所说的两个虚拟机监控程序一起使用,我会使用等量的RZA。每个HV上有3个节点,HV#1上的所有节点都在服务器组#1中,HV#2上的所有节点都在服务器组#2中。不过,您只需要一个副本。对于您提到的故障场景,当整个HV发生故障时,拥有多个复制副本对您毫无帮助。在运行RZA时,如我所述,SG#1中节点的所有副本都在SG#2中的节点上,反之亦然。希望这是有道理的

此外,我们正在讨论的配置中的RZA是生产中仅限企业使用的功能,因此这意味着您已经为其付费(生产中超过2个节点的任何设备都必须获得许可)。我只提到这一点,因为这些东西可以带给您的Couchbase客户经理或技术支持团队,以获得此帮助和其他更详细的帮助