如何减少在Kubernetes上检测节点故障的时间?

如何减少在Kubernetes上检测节点故障的时间?,kubernetes,Kubernetes,我有2个从节点和1个主节点kubernetes群集。当一个节点停机时,kubernetes大约需要5分钟才能看到故障。我正在对卷使用动态资源调配,这一次对我来说有点多。我如何减少检测故障的时间? 我找到了一篇关于它的帖子: 文章的底部写道,我们可以通过改变参数来缩短检测时间: kubelet:节点状态更新频率=4s(从10s开始) 控制器管理器:节点监控周期=2s(从5s开始) 控制器管理器:节点监视器宽限期=16秒(从40秒开始) 控制器管理器:吊舱收回超时=30s(从5m开始) 我可以从k

我有2个从节点和1个主节点kubernetes群集。当一个节点停机时,kubernetes大约需要5分钟才能看到故障。我正在对卷使用动态资源调配,这一次对我来说有点多。我如何减少检测故障的时间? 我找到了一篇关于它的帖子:

文章的底部写道,我们可以通过改变参数来缩短检测时间:

kubelet:节点状态更新频率=4s(从10s开始)
控制器管理器:节点监控周期=2s(从5s开始)
控制器管理器:节点监视器宽限期=16秒(从40秒开始)
控制器管理器:吊舱收回超时=30s(从5m开始)


我可以从kubelet更改节点状态更新频率参数,但cli上没有任何controller manager程序或命令。如何更改该参数?任何关于减少检测停机时间的其他建议都将不胜感激。

实际上是kube controller manager。对于kube控制器管理器,您还可以将--attach-detach-confidence同步周期从1m缩短到15秒或30秒。这将允许更快的卷附加分离操作。如何更改这些参数取决于如何设置集群

…但我没有任何控制器管理器程序或命令 cli.如何更改该参数

您可以在
controller manager
systemd单元文件中更改/添加该参数,然后重新启动守护进程。请检查
控制器管理器的手册页


如果将
控制器管理器
部署为微服务(pod),请检查该pod的清单文件,并在容器的
命令
部分更改参数(例如,like)

可能有一个清单文件:/etc/kubernetes/manifests/kube-controller-manager.yaml我可以添加该标志并应用该清单文件吗?它有用吗?kubectl apply-f kube-controller-manager.yamlYes,您可以修改该清单。之后可能需要重新启动kubelet。不幸的是,清单文件给出了crashloopbackoff。我也尝试了/etc/systemd/system/kubelet.service.d/10-kubeadm.conf,但没有任何效果。当我发出descripe命令时,它没有显示任何内容:退出重新启动失败container@AdiSoyadi,它说什么?我记不太清楚了,你能检查一下这些吊舱是如何部署的吗,即
replicaset
deamonset
kube系统
命名空间中。然后打开
replicaset
/
守护程序的清单文件并进行编辑。感谢您的回复。我的实际问题是我找不到任何关于kube controller manager的文档,我不知道如何设置和使用它。我的群集:2slavex1master本地群集。(virtualbox)您好,请编辑/etc/kubernetes/manifests/kube-controller-manager.yaml并添加community@Veerendra所述的必要标志