Amazon web services 红移节点故障转移

Amazon web services 红移节点故障转移,amazon-web-services,amazon-redshift,failovercluster,Amazon Web Services,Amazon Redshift,Failovercluster,我有一个由4个节点组成的红移集群 当其中一个节点宕机时,整个集群是否会变得不可用 如果是,持续多长时间 当集群返回时—它是否返回到与故障前完全相同的点,或者数据可能从几个小时前回滚到S3快照 我如何模拟这种情况,自己检查这种情况 非常感谢 这恰好发生在我的群集上-其中一个节点出现故障。在仪表板上花了将近20分钟才引起注意(不健康显示在“性能”选项卡上,而健康显示在“状态”选项卡上) 从初始故障开始1小时后,集群将其状态更改为“修改”,再过1小时,新节点就位 “最近的事件”中有一条消息: 亚马逊红

我有一个由4个节点组成的红移集群

  • 当其中一个节点宕机时,整个集群是否会变得不可用
  • 如果是,持续多长时间
  • 当集群返回时—它是否返回到与故障前完全相同的点,或者数据可能从几个小时前回滚到S3快照
  • 我如何模拟这种情况,自己检查这种情况

  • 非常感谢

    这恰好发生在我的群集上-其中一个节点出现故障。在仪表板上花了将近20分钟才引起注意(不健康显示在“性能”选项卡上,而健康显示在“状态”选项卡上)

    从初始故障开始1小时后,集群将其状态更改为“修改”,再过1小时,新节点就位

    “最近的事件”中有一条消息:

    亚马逊红移集群“xxx”上的一个节点在2013-12-18 11:42 UTC时被自动替换。集群现在运行正常

    在整个时间内,群集不可用-没有运行任何查询,无法导入


    数据与发生故障时的数据完全相同。

    如果是单节点故障,amazon将启动一个新节点,并从其他节点传输数据(如果有,每个块将写入两个不同的节点)。 在这种情况下,我们可以预期:

  • 整个集群的停机时间,直到新节点启动+填充数据库信息。大约需要3-4分钟
  • 在这3-4分钟之后,该集群将返回到它崩溃之前的完全相同的点。集群将可用于读取和写入
  • 由于集群中的数据重新分布,会出现一些减速
  • 如果多个节点出现故障,redshift将从最新的S3备份中恢复自身。 S3备份在以下情况下进行:

  • 如果上次备份已经8小时了
  • 如果自上次备份以来,红移填充的数据超过5GB
  • 人工
  • 当您选择终止集群时,您可以选择最终快照

  • 谢谢还有两个问题:您使用2TB还是16TB节点?您的集群实际使用的数据量是多少?如果您可以添加一个引用,指向您在何处找到此信息,那将非常好,谢谢。