Kubernetes 普罗米修斯库伯吊舱集装箱状态等待原因未捕获吊舱坠毁回退原因
根据定义,Kubernetes 普罗米修斯库伯吊舱集装箱状态等待原因未捕获吊舱坠毁回退原因,kubernetes,prometheus,prometheus-alertmanager,prometheus-operator,kube-state-metrics,Kubernetes,Prometheus,Prometheus Alertmanager,Prometheus Operator,Kube State Metrics,根据定义,kube\u pod\u container\u status\u waiting\u reason应该捕获pod处于等待状态的原因 我的kubernetes集群中有几个豆荚在CrashLoopBackOff中,但我看不到由kube\u豆荚\u容器\u状态\u等待\u原因捕获的原因。 它只抓住了两个原因——ErrImagePull和ContainerCreating ~$ k get pods -o wide --show-all --all-namespaces | grep Cra
kube\u pod\u container\u status\u waiting\u reason
应该捕获pod处于等待状态的原因
我的kubernetes集群中有几个豆荚在CrashLoopBackOff中,但我看不到由kube\u豆荚\u容器\u状态\u等待\u原因捕获的原因。
它只抓住了两个原因——ErrImagePull和ContainerCreating
~$ k get pods -o wide --show-all --all-namespaces | grep Crash
cattle-system cattle-cluster-agent-6f744c67cc-jlkjh 0/1 CrashLoopBackOff 2885 10d 10.233.121.247 k8s-4
cattle-system cattle-node-agent-6klkh 0/1 CrashLoopBackOff 2886 171d 10.171.201.127 k8s-2
cattle-system cattle-node-agent-j6r94 0/1 CrashLoopBackOff 2887 171d 10.171.201.110 k8s-3
cattle-system cattle-node-agent-nkfcq 0/1 CrashLoopBackOff 17775 171d 10.171.201.131 k8s-1
cattle-system cattle-node-agent-np76b 0/1 CrashLoopBackOff 2887 171d 10.171.201.89 k8s-4
cattle-system cattle-node-agent-pwn5v 0/1 CrashLoopBackOff 2859 171d 10.171.202.72 k8s-5
在普罗米修斯中运行sum by(reason)(kube\u pod\u container\u status\u waiting\u reason)
会产生以下结果:
Element Value
{reason="ContainerCreating"} 0
{reason="ErrImagePull"} 0
我正在运行quay.io/coreos/kube state metrics:v1.2.0
kube state metrics图像
我错过了什么?为什么CrashLoopBackOff原因没有显示在查询中?
我想设置一个警报,发现吊舱处于等待状态,并说明原因。因此,考虑合并kube\u pod\u container\u status\u waiting
以查找处于等待状态的pod和kube\u pod\u container\u waiting\u reason
以查找确切原因
请帮忙。谢谢大家! 您正在遇到。基本上,看起来您正在使用1.2.0
或更早版本。您可以看到,在1.3.0
中添加了ImagePullBackOff
和CrashLoopBackOff
因此,请将您的图像更新为:
k8s.gcr.io/kube-state-metrics:v1.3.0
quay.io/coreos/kube-state-metrics:v1.3.0
或
k8s.gcr.io/kube-state-metrics:v1.4.0
quay.io/coreos/kube-state-metrics:v1.4.0