普罗米修斯运营者+;新的Kubernetes Minikube=死区开关+;KubeControllerManagerDown&x2B;KubeSchedulerDown&x2B;瞄准目标

普罗米修斯运营者+;新的Kubernetes Minikube=死区开关+;KubeControllerManagerDown&x2B;KubeSchedulerDown&x2B;瞄准目标,kubernetes,prometheus,minikube,prometheus-operator,Kubernetes,Prometheus,Minikube,Prometheus Operator,如果我启动一个全新的干净的空minikube和头盔安装最新的稳定/普罗米修斯操作员,使用严格的默认设置,我会看到四个激活的普罗米修斯警报 在这个超级简化的场景中,我有一个全新的minikube,除了普罗米修斯,它什么都没有运行,应该没有问题,也没有警报。这些警报是假的还是坏了?我的设置是否有问题,或者我是否应该提交错误报告并暂时禁用这些警报 以下是我的基本设置步骤: minikube delete # Any lower memory/cpu settings will experience p

如果我启动一个全新的干净的空minikube和
头盔安装
最新的
稳定/普罗米修斯操作员
,使用严格的默认设置,我会看到四个激活的普罗米修斯警报

在这个超级简化的场景中,我有一个全新的minikube,除了普罗米修斯,它什么都没有运行,应该没有问题,也没有警报。这些警报是假的还是坏了?我的设置是否有问题,或者我是否应该提交错误报告并暂时禁用这些警报

以下是我的基本设置步骤:

minikube delete
# Any lower memory/cpu settings will experience problems
minikube start --memory 10240 --cpus 4 --kubernetes-version v1.12.2
eval $(minikube docker-env)
helm init
helm repo update
# wait a minute for Helm Tiller to start up.
helm install --name my-prom stable/prometheus-operator
等待几分钟,等待一切启动,然后在Prometheus服务器和Grafana上运行端口转发:

kubectl port-forward service/my-prom-prometheus-operato-prometheus 9090:9090
kubectl port-forward service/my-prom-grafana 8080:80
然后转到
http://localhost:9090/alerts
,请参阅:

DeadMansSwitch (1 active)
KubeControllerManagerDown (1 active)
KubeSchedulerDown (1 active)
TargetDown (1 active)
这些是假的吗?真的出了什么问题吗?我应该禁用这些吗

其中两个警报缺少指标:

  • KubeControllerManagerDown:
    缺席(up{job=“kube controller manager”}==1)
  • KubeSchedulerDown:
    缺席(up{job=“kube scheduler”}==1)
http://localhost:9090/config
,我看不到任何一个作业已配置,但我确实看到了与
作业名称
值密切相关的作业,这些值分别为
default/my prometheus operato kube controller manager/0
default/my prometheus operato kube scheduler/0
。这表明
job\u name
值应该匹配,并且存在不匹配的bug。我也没有看到任何收集到的工作指标。作业名称中是否允许使用斜杠

其他两个警报:

  • 死区开关:报警表达式为
    向量(1)
    。我不知道这是什么
  • TargetDown:此报警是在具有两个度量值的
    up{job=“kubelet”}
    上触发的,一个向上的值为1.0,另一个向下的值为0.0。向上值用于
    endpoint=“http metrics”
    ,向下值用于
    endpoint=“cadvisor”
    。后一个端点应该是向上的吗?为什么不呢
我去
http://localhost:9090/graph
并运行
按(作业)求和
我看到
1.0
所有值:

{job="node-exporter"}
{job="my-prom-prometheus-operato-prometheus"}
{job="my-prom-prometheus-operato-operator"}
{job="my-prom-prometheus-operato-alertmanager"}
{job="kubelet"}
{job="kube-state-metrics"}
{job="apiserver"}
仅供参考,
kubectl版本
显示:

Client Version: version.Info{Major:"1", Minor:"12", GitVersion:"v1.12.2", GitCommit:"17c77c7898218073f14c8d573582e8d2313dc740", GitTreeState:"clean", BuildDate:"2018-10-30T21:39:16Z", GoVersion:"go1.11.1", Compiler:"gc", Platform:"darwin/amd64"}
Server Version: version.Info{Major:"1", Minor:"12", GitVersion:"v1.12.2", GitCommit:"17c77c7898218073f14c8d573582e8d2313dc740", GitTreeState:"clean", BuildDate:"2018-10-24T06:43:59Z", GoVersion:"go1.10.4", Compiler:"gc", Platform:"linux/amd64"}

DeadManSwitchAlarm是向量(1),它是一个始终触发的警报,通常用于测试您的alertmanager是否工作

你可能正在讨论这个问题


希望这能有所帮助。

DeadManSwitchAlarm是一个向量(1),它是一个总是会触发的警报,通常用于测试您的alertmanager是否工作

你可能正在讨论这个问题

希望这有帮助。

警报(以前称为
死门开关
)是:

旨在确保整个警报管道正常运行的警报。 此警报始终处于触发状态,因此应始终在Alertmanager中触发 总是对着听筒开枪

在Minikube中,默认情况下,
kube控制器管理器
kube调度程序
在127.0.0.1上侦听,因此普罗米修斯无法从中获取度量。您需要启动Minikube,让这些组件监听所有接口:

minikube start --kubernetes-version v1.12.2 \
--bootstrapper=kubeadm \
--extra-config=scheduler.address=0.0.0.0 \
--extra-config=controller-manager.address=0.0.0.0
TargetDown
的另一个原因是普罗米修斯操作员头盔图表创建的默认服务选择器与Minikube组件使用的标签不匹配。您需要通过设置
kubeControllerManager.selector
kubeScheduler.selector
helm参数来匹配它们

请看这篇文章:。它解决了所有这些问题、如何解决这些问题以及更多问题。

警报(以前称为
死门开关
)是:

旨在确保整个警报管道正常运行的警报。 此警报始终处于触发状态,因此应始终在Alertmanager中触发 总是对着听筒开枪

在Minikube中,默认情况下,
kube控制器管理器
kube调度程序
在127.0.0.1上侦听,因此普罗米修斯无法从中获取度量。您需要启动Minikube,让这些组件监听所有接口:

minikube start --kubernetes-version v1.12.2 \
--bootstrapper=kubeadm \
--extra-config=scheduler.address=0.0.0.0 \
--extra-config=controller-manager.address=0.0.0.0
TargetDown
的另一个原因是普罗米修斯操作员头盔图表创建的默认服务选择器与Minikube组件使用的标签不匹配。您需要通过设置
kubeControllerManager.selector
kubeScheduler.selector
helm参数来匹配它们

请看这篇文章:。它解决了所有这些问题、如何解决这些问题以及更多问题。

检查此显示运行手册以了解各种监控警报。检查此显示运行手册以了解各种监控警报。