Grafana警报-根据Spring Boot Prometheus metrics的新条件检查发送警报通知
我正在尝试使用Grafana为从普罗米修斯(Prometheus)那里获取的Spring Boot指标创建警报。用例用于警告每个服务引发的异常。我使用的是http\u server\u requests\u seconds\u count度量,下面提到的是我用来创建图的PromQL查询的分解Grafana警报-根据Spring Boot Prometheus metrics的新条件检查发送警报通知,prometheus,spring-boot-actuator,spring-micrometer,grafana-alerts,Prometheus,Spring Boot Actuator,Spring Micrometer,Grafana Alerts,我正在尝试使用Grafana为从普罗米修斯(Prometheus)那里获取的Spring Boot指标创建警报。用例用于警告每个服务引发的异常。我使用的是http\u server\u requests\u seconds\u count度量,下面提到的是我用来创建图的PromQL查询的分解 首先,我排除了所有不会引发异常的指标 http\u服务器\u请求\u秒数\u计数{application=“my-service-1”,异常!~“None”} 接下来,我应用了rate()函数,因为默认
- 首先,我排除了所有不会引发异常的指标
http\u服务器\u请求\u秒数\u计数{application=“my-service-1”,异常!~“None”}
- 接下来,我应用了
函数,因为默认度量只提供了一个单调的值rate()
速率(http\u服务器\u请求\u秒数\u计数{application=“my-service-1”,异常!~“无”}[5m])
- 然后我使用以下条件触发警报。(使用
函数作为max()
和sum()
函数会考虑数据点,这不是我的要求)count()
当查询(A,5m,现在)的max()大于0.02时
每1m评估5m
count\u over\u time(http\u server\u请求秒数\u count{application=“my-service-1”,exception!~“None”}[5m])