Grafana 普罗米修斯在缺席的情况下随时间使用平均值

Grafana 普罗米修斯在缺席的情况下随时间使用平均值,grafana,prometheus,promql,Grafana,Prometheus,Promql,我们已经开始使用普罗米修斯来监控我们的基础设施。一个服务配置了以下警报: (缺席(up{job=“service”})或(up{job=“service”}==0)+1)==1 这样,如果“up”为零或无法访问任何指标,我们将收到警报 现在我们需要一个显示服务“正常运行时间”的grafana“single stat”面板,但“缺席”不能与“avg_over_time”一起使用,有一个选项可以在正常运行时间面板中包含类似“缺席”的内容?您可以通过以下方式进行近似: sum_over_time(

我们已经开始使用普罗米修斯来监控我们的基础设施。一个服务配置了以下警报:

  • (缺席(up{job=“service”})或(up{job=“service”}==0)+1)==1
这样,如果“up”为零或无法访问任何指标,我们将收到警报


现在我们需要一个显示服务“正常运行时间”的grafana“single stat”面板,但“缺席”不能与“avg_over_time”一起使用,有一个选项可以在正常运行时间面板中包含类似“缺席”的内容?

您可以通过以下方式进行近似:

sum_over_time(up{job="service"}[24h]) / sum_over_time(up{job="prometheus"}[24h])
这将把记录你的服务“上升”(过去24小时)的样本数除以记录普罗米修斯“上升”的样本数

否则,您可以使用记录规则来记录类似于您的警报条件的内容,如果您的服务已启动,则该规则的值为1,否则为0。然后您可以在该度量上使用
avg\u over\u time()