Prometheus Grafana在普罗米修斯/普什盖特有旧数据时发出警报

Prometheus Grafana在普罗米修斯/普什盖特有旧数据时发出警报,prometheus,grafana,alarm,Prometheus,Grafana,Alarm,我有几个客户将他们的度量标准推到了一个新的位置,然后就被别人抢走了。最后,我使用的是仪表盘——我想这不是一个太奇特的设置 让我困惑的是,当其中一个客户停止工作,不再推送它的指标时,推送网关将进一步向普罗米修斯提供它收到的最后一个值,而格拉法纳将高兴地显示一条水平线 但是,如果指标太旧,我更希望收到警报。如何做到这一点?普罗米修斯用time()提供当前时间,time()提供自1970年1月1日UTC以来的秒数。 Pushgateway为每个作业保留一个度量:push_time_seconds,它显

我有几个客户将他们的度量标准推到了一个新的位置,然后就被别人抢走了。最后,我使用的是仪表盘——我想这不是一个太奇特的设置

让我困惑的是,当其中一个客户停止工作,不再推送它的指标时,推送网关将进一步向普罗米修斯提供它收到的最后一个值,而格拉法纳将高兴地显示一条水平线


但是,如果指标太旧,我更希望收到警报。如何做到这一点?

普罗米修斯用time()提供当前时间,time()提供自1970年1月1日UTC以来的秒数。 Pushgateway为每个作业保留一个度量:push_time_seconds,它显示自UTC 1970年1月1日以来最后一次推入秒的时间

所以这个问题

time() - push_time_seconds

将以秒为单位显示您所拥有的每个导出工作的年龄。现在,如果该值超过定义的阈值,则很容易进一步过滤和报警。对于预期每天运行一次的作业(因此它们的度量值预计不会超过24小时),我在Grafana中将阈值配置为25小时(90000秒),它工作起来很有魅力。

普罗米修斯提供了当前时间和时间(),它提供了自1970年UTC 1月1日以来的秒数。 Pushgateway为每个作业保留一个度量:push_time_seconds,它显示自UTC 1970年1月1日以来最后一次推入秒的时间

所以这个问题

time() - push_time_seconds
将以秒为单位显示您所拥有的每个导出工作的年龄。现在,如果该值超过定义的阈值,则很容易进一步过滤和报警。对于预期每天运行一次的作业(因此它们的度量值预计不会超过24小时),我在Grafana中将阈值配置为25小时(90000秒),它工作起来很有魅力