Kubernetes 库伯内特斯/普罗米修斯度量不匹配
我有一个运行在Kubernetes(Azure AKS)中的应用程序,其中每个pod包含两个容器。我还设置了Grafana来显示各种指标,其中一些指标来自普罗米修斯。我试图解决一个单独的问题,在这样做的过程中,我注意到一些指标在数据源之间似乎不匹配 例如,Kubernetes 库伯内特斯/普罗米修斯度量不匹配,kubernetes,prometheus,Kubernetes,Prometheus,我有一个运行在Kubernetes(Azure AKS)中的应用程序,其中每个pod包含两个容器。我还设置了Grafana来显示各种指标,其中一些指标来自普罗米修斯。我试图解决一个单独的问题,在这样做的过程中,我注意到一些指标在数据源之间似乎不匹配 例如,kube\u deployment\u status\u replicas\u available返回值30,而kubectl-n XXXXXXXX get pod列出100个正在运行的组件,而kube\u deployment\u statu
kube\u deployment\u status\u replicas\u available
返回值30,而kubectl-n XXXXXXXX get pod
列出100个正在运行的组件,而kube\u deployment\u status\u replicas\u available
返回值0。另外,如果我使用kubectl
得到有问题的部署,我会看到预期值
$ kubectl get deployment XXXXXXXX
NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE
XXXXXXXX 100 100 100 100 49d
同一集群中还有其他应用程序(名称空间),其中所有值都正确关联,因此我不确定故障可能在哪里,或者是否有任何方法可以确定哪个值是正确的。任何指导都将不胜感激。谢谢基于
kube\u部署状态\u副本\u可用
指标,我假设普罗米修斯从中删除了您的指标。听起来它的部署有些奇怪。它可以是:
- 缓存的度量数据
- 和/或简单地说,它无法从
- 检查您正在运行的版本,看看它是否与您的K8s版本兼容
- 重新启动kube状态度量吊舱
- 检查日志
kubectl日志
kube状态度量`
- 检查普罗米修斯的日志
- 如果您没有看到任何东西,请尝试使用
标志启动普罗米修斯--log.level=debug
- 如果您没有看到任何东西,请尝试使用
希望有帮助。非常感谢。在我重新启动
kube state metrics
pod之后,Grafana中的值更新了。我应该补充的是,我在另一个集群上遇到了似乎相同的问题,除了重新启动kube state metrics
pod外,还必须重新启动Prometheus pod,因为似乎有一些损坏的数据