Azure service fabric 服务结构-无法进行配置升级以添加或删除节点
我有一个内部服务结构,由18个节点(9个是种子节点)组成,通过gMSA windows安全保护。群集代码版本6.4.622.9590 不幸的是,我必须重建其中的6个节点(3个种子节点)。它们都位于一个数据中心(集群跨越3个DCs)。因此,我希望删除这6个节点,重建它们,然后重新添加它们 根据,通过配置升级来执行节点的添加/删除。注意:我最近已经使用这个过程添加了12个节点,因此很好地理解了SF配置升级的概念 不幸的是,在删除节点之前,我无法在此群集上执行任何配置升级-这是由于Azure service fabric 服务结构-无法进行配置升级以添加或删除节点,azure-service-fabric,service-fabric-on-premises,Azure Service Fabric,Service Fabric On Premises,我有一个内部服务结构,由18个节点(9个是种子节点)组成,通过gMSA windows安全保护。群集代码版本6.4.622.9590 不幸的是,我必须重建其中的6个节点(3个种子节点)。它们都位于一个数据中心(集群跨越3个DCs)。因此,我希望删除这6个节点,重建它们,然后重新添加它们 根据,通过配置升级来执行节点的添加/删除。注意:我最近已经使用这个过程添加了12个节点,因此很好地理解了SF配置升级的概念 不幸的是,在删除节点之前,我无法在此群集上执行任何配置升级-这是由于Start serv
Start servicefactClusterConfigurationUpgrade
powershell命令报告的ValidationException:
- 如果我没有将这6个节点添加到“NodesToBeRemoved”部分,我会得到一个验证错误,即并非所有删除的节点都在该字段中
- 如果添加6个节点,则会出现以下验证错误:
那么,如何让我们的生产集群摆脱这种局面呢?重建群集不是一个选项(这是群集…高可用性的全部原因!)。我发现上述错误主要是由于在执行service fabric配置升级时,缺少明确记录的过程以及错误/误导性错误消息 我自己做了很多测试,以确保能够自信地在集群中添加/删除多个节点。我还删除了足够多的节点,以便将种子节点从9删除到6 因此,要解决上述问题,我必须做以下操作来删除节点:
- 您可以一次删除多个种子节点(我想这样做是为了尝试并复制上述场景)
- 您也可以一次添加多个节点-请注意,通过SF config升级状态工具,您可能看不到任何活动/指示 正在发生任何事情…请准备等待至少15分钟 (取决于要添加的节点数…毕竟,SF正在复制 将安装文件添加到节点)
- 有时,当删除一个或多个节点时,该节点将无法成功删除,但仍处于错误状态
在这种情况下,请使用SF Explorer(或powershell)删除节点状态。状态
将更改为无效。此时,请执行另一个配置升级
确保:
- 删除的节点不在“节点”部分中
- 删除的节点不在NodeStoreMoved列表中
- 如上所述,如果NodesToBeRemoved的值为空(或应该为空),请删除整个JSON块,否则您将收到关于NodesToBeRemoved参数包含不一致信息的误导性/模糊警告
Get-ServiceFabricClusterConfiguration
仍将在NodesToBeRemoved参数中返回已删除的节点。这可能会让您在后续尝试执行某项操作时感到困惑/困惑配置升级。因此,我建议您在完全删除此部分的情况下进行另一次最终配置升级
最后,请注意:如果重新添加以前已删除的节点,它可能会以停用状态返回。只需激活此节点,一切都会正常
Start-ServiceFabricClusterConfigurationUpgrade :
System.Runtime.InteropServices.COMException (-2147017627)
ValidationException: Model validation error. Removing a non-seed node and changing reliability level in the same
upgrade is not supported. Initiate an upgrade to remove node first and then change the reliability level.
At line:1 char:1
+ Start-ServiceFabricClusterConfigurationUpgrade -ClusterConfigPath "AL ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo : InvalidOperation: (Microsoft.Servi...usterConnection:ClusterConnection) [Start-ServiceFa
...gurationUpgrade], FabricException
+ FullyQualifiedErrorId : StartClusterConfigurationUpgradeErrorId,Microsoft.ServiceFabric.Powershell.StartClusterC
onfigurationUpgrade