Windows 在NLB中服务器处于活动状态时检测死机应用程序

Windows 在NLB中服务器处于活动状态时检测死机应用程序,windows,load-balancing,cluster-computing,Windows,Load Balancing,Cluster Computing,Windows NLB工作得很好,在计算机死机时将计算机从群集中删除 但是,如果应用程序死亡,但服务器仍然工作正常,会发生什么?你是如何解决这个问题的 感谢您不要使用NLB 硬件负载平衡器通常具有可配置的“探测”功能,以确定服务器是否响应请求。这可以通过访问真实的应用程序端口/URL,或仅在应用程序运行正常时返回的特定“healthcheck”URL来实现 其他选项将查看响应请求所需的队列/时间 思科这样说: Cisco CSM持续监控服务器和应用程序的可用性 使用各种探头,带内 健康监控,返回

Windows NLB工作得很好,在计算机死机时将计算机从群集中删除

但是,如果应用程序死亡,但服务器仍然工作正常,会发生什么?你是如何解决这个问题的

感谢您不要使用NLB

硬件负载平衡器通常具有可配置的“探测”功能,以确定服务器是否响应请求。这可以通过访问真实的应用程序端口/URL,或仅在应用程序运行正常时返回的特定“healthcheck”URL来实现

其他选项将查看响应请求所需的队列/时间

思科这样说:

Cisco CSM持续监控服务器和应用程序的可用性 使用各种探头,带内 健康监控,返回代码 检查和动态反馈 协议(DFP)。当一个真正的服务器或 发生网关故障时,Cisco CSM 将流量重定向到其他位置 地点。添加和删除服务器 无中断地移除 服务系统易于扩展 还是下来


(从这里开始:)

大概在Windows NLB中有某种方法可以通过编程设置节点的权重?节点应进行自我监控,如果出现问题(例如,某个特定节点的磁盘空间不足),则将其权重设置为零,以使其不再接收更多流量

但是,这需要仔细设计,并有进一步的人工监控,以确保不会出现一个故障导致整个集群宣布停机的情况


在网络负载平衡方面,你不可能真的希望处理“拜占庭式的一般”情况;适当断开的节点可能会认为它很好,看起来很好,但却完全无法执行任何实际工作。诀窍是尽量减少这些情况在生产中发生的可能性。

网络应用程序有多个健康检查级别

  • 服务器启动了吗?
    • 应用程序(服务)正在运行吗
    • 该服务是否接受网络连接
    • 服务是否适当地响应“您还好吗”请求
    • 该服务是否执行实际工作?(这还将检查您正在探测的服务背后的后端系统)
  • 我的NLB经验可能不完整,但我会描述我所知道的。NLB可以做1和2。通过自定义编码,您可以添加不同难度的其他级别。对于某些网络架构,这可能非常困难


    来自Cisco或F5等供应商的大多数硬件负载平衡器可以轻松配置为执行3或4。5级测试仍然需要自定义编码。

    我们从所有节点都是集群的一部分但不活动的情况开始。 我们运行一个定制的服务监视器,它通过外部接口在本地对服务发出请求。如果响应成功,我们将启动节点(允许它开始处理NLB流量)。如果响应失败,我们将停止节点接收流量

    达伦描述的所有中间步骤都是无关的。它是否有效是我们唯一关心的事情。如果机器不可访问,则NLB集群的其余部分将视其为失败