Kubernetes 库伯内特斯/普罗米修斯度量不匹配

Kubernetes 库伯内特斯/普罗米修斯度量不匹配,kubernetes,prometheus,Kubernetes,Prometheus,我有一个运行在Kubernetes(Azure AKS)中的应用程序,其中每个pod包含两个容器。我还设置了Grafana来显示各种指标,其中一些指标来自普罗米修斯。我试图解决一个单独的问题,在这样做的过程中,我注意到一些指标在数据源之间似乎不匹配 例如,kube\u deployment\u status\u replicas\u available返回值30,而kubectl-n XXXXXXXX get pod列出100个正在运行的组件,而kube\u deployment\u statu

我有一个运行在Kubernetes(Azure AKS)中的应用程序,其中每个pod包含两个容器。我还设置了Grafana来显示各种指标,其中一些指标来自普罗米修斯。我试图解决一个单独的问题,在这样做的过程中,我注意到一些指标在数据源之间似乎不匹配

例如,
kube\u deployment\u status\u replicas\u available
返回值30,而
kubectl-n XXXXXXXX get pod
列出100个正在运行的组件,而
kube\u deployment\u status\u replicas\u available
返回值0。另外,如果我使用
kubectl
得到有问题的部署,我会看到预期值

$ kubectl get deployment XXXXXXXX
NAME       DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
XXXXXXXX   100       100       100          100         49d

同一集群中还有其他应用程序(名称空间),其中所有值都正确关联,因此我不确定故障可能在哪里,或者是否有任何方法可以确定哪个值是正确的。任何指导都将不胜感激。谢谢

基于
kube\u部署状态\u副本\u可用
指标,我假设普罗米修斯从中删除了您的指标。听起来它的部署有些奇怪。它可以是:

  • 缓存的度量数据
  • 和/或简单地说,它无法从
我想:

  • 检查您正在运行的版本,看看它是否与您的K8s版本兼容
  • 重新启动kube状态度量吊舱
  • 检查日志
    kubectl日志
    kube状态度量`
  • 检查普罗米修斯的日志
    • 如果您没有看到任何东西,请尝试使用
      --log.level=debug
      标志启动普罗米修斯

希望有帮助。

非常感谢。在我重新启动
kube state metrics
pod之后,Grafana中的值更新了。我应该补充的是,我在另一个集群上遇到了似乎相同的问题,除了重新启动
kube state metrics
pod外,还必须重新启动Prometheus pod,因为似乎有一些损坏的数据