Kubernetes Gridgain分区随节点规模减小而丢失

Kubernetes Gridgain分区随节点规模减小而丢失,kubernetes,google-cloud-platform,ignite,gridgain,Kubernetes,Google Cloud Platform,Ignite,Gridgain,我们在GoogleKubernetes集群中部署了Gridgain集群,它可以在支持持久性的情况下正常工作。我们需要启用自动缩放功能。放大时没有任何错误,但缩小时给出“分区丢失”。我们需要使用control.sh脚本恢复丢失的分区。但不可能每次都这样 解决这个问题的办法是什么?“按比例缩小”对Gridgain节点不起作用吗?通常,您应该有足够的备份系数来补偿丢失的节点(例如,如果备份数为2,则最多可以同时丢失2个节点) 再加上baselineAutoAdjust设置为合理值,它应提供缩放功能 在

我们在GoogleKubernetes集群中部署了Gridgain集群,它可以在支持持久性的情况下正常工作。我们需要启用自动缩放功能。放大时没有任何错误,但缩小时给出“分区丢失”。我们需要使用control.sh脚本恢复丢失的分区。但不可能每次都这样


解决这个问题的办法是什么?“按比例缩小”对Gridgain节点不起作用吗?

通常,您应该有足够的备份系数来补偿丢失的节点(例如,如果备份数为2,则最多可以同时丢失2个节点)

再加上baselineAutoAdjust设置为合理值,它应提供缩放功能


在启用数据丢失和持久性的情况下按比例缩小确实需要重置丢失的分区。

通常,您应该有足够的备份系数来补偿丢失的节点(例如,如果备份=2,您最多可以同时丢失2个节点)

再加上baselineAutoAdjust设置为合理值,它应提供缩放功能


在启用数据丢失和持久性的情况下按比例缩小确实需要重置丢失的分区。

除了@alamar的答案外,您还需要确保节点正常停止。对数据执行额外的验证,并确保在节点离开时不会丢失集群中的分区

您可以通过搜索以下消息来验证正常关闭:

Invoking shutdown hook...
...
Ensuring that caches have sufficient backups and local rebalance completion...
您可以使用以下选项进行设置:

  • 配置系统属性
  • 使用XML/code配置明确地设置为优雅。默认值为
我觉得有时候我可以看到带有system属性的#1方法在k8s世界中可能无法很好地工作。如果第一个点火器似乎工作不正常,请使用显式点火器配置调整检查后一个点火器


除上述内容外,您可能还需要禁用BaslientAutoAdjustment(如果启用),以防止数据重新平衡以进行短时间的上下扩展。

除了@alamar的答案外,您还需要确保节点正常停止。对数据执行额外的验证,并确保在节点离开时不会丢失集群中的分区

您可以通过搜索以下消息来验证正常关闭:

Invoking shutdown hook...
...
Ensuring that caches have sufficient backups and local rebalance completion...
您可以使用以下选项进行设置:

  • 配置系统属性
  • 使用XML/code配置明确地设置为优雅。默认值为
我觉得有时候我可以看到带有system属性的#1方法在k8s世界中可能无法很好地工作。如果第一个点火器似乎工作不正常,请使用显式点火器配置调整检查后一个点火器

除上述内容外,您可能希望禁用BaslientAutoAdjustment(如果启用),以防止数据重新平衡,从而实现短期的上下扩展