在GKE节点自动缩放期间,HPA无法获取CPU度量 群集信息: Kubernetes版本:1.12.8-gke.10 正在使用的云:GKE 安装方法:gcloud 主机操作系统:(机器类型)n1-standard-1 CNI和版本:默认值 CRI和版本:默认值
在节点扩展期间,HPA无法获取CPU度量 同时,在GKE节点自动缩放期间,HPA无法获取CPU度量 群集信息: Kubernetes版本:1.12.8-gke.10 正在使用的云:GKE 安装方法:gcloud 主机操作系统:(机器类型)n1-standard-1 CNI和版本:默认值 CRI和版本:默认值,kubernetes,google-kubernetes-engine,Kubernetes,Google Kubernetes Engine,在节点扩展期间,HPA无法获取CPU度量 同时,kubectl-top-pod和kubectl-top-node输出为: 服务器错误(serviceinavailable):服务器当前无法处理请求(get pods.metrics.k8s.io) 服务器出错(ServiceUnavailable):服务器当前无法处理请求(get nodes.metrics.k8s.io) 有关更多详细信息,我将向您展示出现问题的流程: 突然,许多请求到达了GKE服务器。(使用测试工具) HPA检测到当前CPU使
kubectl-top-pod
和kubectl-top-node
输出为:
服务器错误(serviceinavailable):服务器当前无法处理请求(get pods.metrics.k8s.io)
服务器出错(ServiceUnavailable):服务器当前无法处理请求(get nodes.metrics.k8s.io)
有关更多详细信息,我将向您展示出现问题的流程:
CPU不足
在创建POD时出现警告,因此GKE尝试向上扩展节点
逐渐地kubectl top node
或kubectl top pod
没有得到回应。
-此时发现一个或多个OutOfcpu
pod,并且有几个pod位于ContainerCreating
(来自Pending
状态)我可以让我的集群像这样工作吗?也许您的节点耗尽了内存或cpu中的一个资源,有一些配置映射描述了插件是如何根据集群大小进行缩放的。您需要在kube系统命名空间中编辑metrics服务器配置配置映射:
kubectl edit cm/metrics-server-config -n kube-system
你应该加上
baseCPU
cpuPerNode
baseMemory
memoryPerNode
要查看配置,您可以找到详细的手册:
此外,heapster还面临相同的OOM问题:太多的POD无法处理分配资源中的所有指标。请相应地修改heapster的配置映射:
kubectl edit cm/heapster-config -n kube-system
可能您的节点耗尽了一个资源(内存或cpu),有一些配置映射描述了如何根据集群大小扩展插件。您需要在kube系统命名空间中编辑metrics服务器配置配置映射:
kubectl edit cm/metrics-server-config -n kube-system
你应该加上
baseCPU
cpuPerNode
baseMemory
memoryPerNode
要查看配置,您可以找到详细的手册:
此外,heapster还面临相同的OOM问题:太多的POD无法处理分配资源中的所有指标。请相应地修改heapster的配置映射:
kubectl edit cm/heapster-config -n kube-system
我以前从未见过这个,所以这可能是一个有用的建议。我来看看这些地图。谢谢。我以前从未见过这个,所以这可能是一个有用的建议。我来看看这些地图。非常感谢。