Grafana 使用AlertManager在远程POD Ping失败时发出警报

Grafana 使用AlertManager在远程POD Ping失败时发出警报,grafana,prometheus,prometheus-alertmanager,Grafana,Prometheus,Prometheus Alertmanager,在使用AlertManager的Prometheus中,我试图为一个自定义度量编写一个警报,该度量存储集群中节点最后一次ping的时间戳。如果在有无过滤器的图形中查看它,它将线性向上缩放 我尝试过使用其他函数,如rate()、changes()、resets(),但效果有限 我已经想出了一些类似于下面的方法,但效果有限: delta(ping_时间戳[5m])

在使用AlertManager的Prometheus中,我试图为一个自定义度量编写一个警报,该度量存储集群中节点最后一次ping的时间戳。如果在有无过滤器的图形中查看它,它将线性向上缩放

我尝试过使用其他函数,如rate()、changes()、resets(),但效果有限

我已经想出了一些类似于下面的方法,但效果有限:
delta(ping_时间戳[5m])<20


我的目标是在我发出警报之前,找出5分钟的响应间隔。虽然我想知道是否有更好的解决方案。

您基本上想要普罗米修斯提供的“向上”度量。您不需要为最后一次ping存储时间戳。您所需要的只是一个1/0值(did response,did not response),然后您可以设置警报,比如:expr:custom_metric==0 for:5m