Kubernetes 找出普罗米修斯中标签的不同值并设置警报

Kubernetes 找出普罗米修斯中标签的不同值并设置警报,kubernetes,monitoring,prometheus,prometheus-alertmanager,Kubernetes,Monitoring,Prometheus,Prometheus Alertmanager,我有一个例子,我想设置一个警报,其中至少有一个标签值是不同的 例如,Kubernetes集群xyz(有20个节点)的度量test_metric{cluster\u name=“xyz”,os=“ubuntu”}。如果这20个节点中的任何一个具有不同的“os”值,我想找出/设置一个警报 基本上,其想法是在集群中所有节点的操作系统值不相同时获取警报 目前,我正在测试一个非常简单的规则,我认为这是不正确的: count(test_metric{cluster_name="xyz",os!=""} !=

我有一个例子,我想设置一个警报,其中至少有一个标签值是不同的

例如,Kubernetes集群xyz(有20个节点)的度量
test_metric{cluster\u name=“xyz”,os=“ubuntu”}
。如果这20个节点中的任何一个具有不同的“os”值,我想找出/设置一个警报

基本上,其想法是在集群中所有节点的操作系统值不相同时获取警报

目前,我正在测试一个非常简单的规则,我认为这是不正确的:

count(test_metric{cluster_name="xyz",os!=""} != count(test_metric{cluster_name="xyz",os!=""})

嵌套计数是处理此问题的方法:

count by (cluster_name) (
   count by (os, cluster_name)(test_metric)
) != 1

嵌套计数是处理此问题的方法:

count by (cluster_name) (
   count by (os, cluster_name)(test_metric)
) != 1