Performance 警报优先级-100%脱机生产主机vs环境警报(100%cab硬件过热)

Performance 警报优先级-100%脱机生产主机vs环境警报(100%cab硬件过热),performance,architecture,monitoring,Performance,Architecture,Monitoring,在标题中列出的两个警报中,您会优先修复哪个警报 我认为环境警报更重要,因为物理硬件的损失可能比暂时停止生产更具破坏性。但生产主机100%离线也是一个主要问题 我想我很难确定在一个规模庞大的系统中,这两个系统每分钟的损失值 如果两个警报针对同一环境,则“生产中断”似乎是“硬件过热”的结果 因此,后者可能是需要首先解决的根本原因 从逻辑上讲,如果硬件过热,就不会有任何剩余的生产运行。除非你已经准备好了非现场DR系统。在这种情况下,警报可以由不同的人同时执行。也就是说,可能有一个团队负责生产正常运行时

在标题中列出的两个警报中,您会优先修复哪个警报

我认为环境警报更重要,因为物理硬件的损失可能比暂时停止生产更具破坏性。但生产主机100%离线也是一个主要问题


我想我很难确定在一个规模庞大的系统中,这两个系统每分钟的损失值

如果两个警报针对同一环境,则“生产中断”似乎是“硬件过热”的结果

因此,后者可能是需要首先解决的根本原因

从逻辑上讲,如果硬件过热,就不会有任何剩余的生产运行。除非你已经准备好了非现场DR系统。在这种情况下,警报可以由不同的人同时执行。也就是说,可能有一个团队负责生产正常运行时间,他们将更多地关注第一个警报,另一个团队负责硬件,将关注第二个警报。因此,让最终用户可以配置优先级可能是值得的