Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/mercurial/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在GKE节点自动缩放期间,HPA无法获取CPU度量 群集信息: Kubernetes版本:1.12.8-gke.10 正在使用的云:GKE 安装方法:gcloud 主机操作系统:(机器类型)n1-standard-1 CNI和版本:默认值 CRI和版本:默认值_Kubernetes_Google Kubernetes Engine - Fatal编程技术网

在GKE节点自动缩放期间,HPA无法获取CPU度量 群集信息: Kubernetes版本:1.12.8-gke.10 正在使用的云:GKE 安装方法:gcloud 主机操作系统:(机器类型)n1-standard-1 CNI和版本:默认值 CRI和版本:默认值

在GKE节点自动缩放期间,HPA无法获取CPU度量 群集信息: Kubernetes版本:1.12.8-gke.10 正在使用的云:GKE 安装方法:gcloud 主机操作系统:(机器类型)n1-standard-1 CNI和版本:默认值 CRI和版本:默认值,kubernetes,google-kubernetes-engine,Kubernetes,Google Kubernetes Engine,在节点扩展期间,HPA无法获取CPU度量 同时,kubectl-top-pod和kubectl-top-node输出为: 服务器错误(serviceinavailable):服务器当前无法处理请求(get pods.metrics.k8s.io) 服务器出错(ServiceUnavailable):服务器当前无法处理请求(get nodes.metrics.k8s.io) 有关更多详细信息,我将向您展示出现问题的流程: 突然,许多请求到达了GKE服务器。(使用测试工具) HPA检测到当前CPU使

在节点扩展期间,HPA无法获取CPU度量

同时,
kubectl-top-pod
kubectl-top-node
输出为:
服务器错误(serviceinavailable):服务器当前无法处理请求(get pods.metrics.k8s.io)
服务器出错(ServiceUnavailable):服务器当前无法处理请求(get nodes.metrics.k8s.io)

有关更多详细信息,我将向您展示出现问题的流程:

  • 突然,许多请求到达了GKE服务器。(使用测试工具)
  • HPA检测到当前CPU使用率高于目标CPU使用率(50%),因此尝试pod放大 逐渐地
  • CPU不足
    在创建POD时出现警告,因此GKE尝试向上扩展节点 逐渐地
  • 很快,HPA无法获取度量,并且
    kubectl top node
    kubectl top pod
    没有得到回应。 -此时发现一个或多个
    OutOfcpu
    pod,并且有几个pod位于
    ContainerCreating
    (来自
    Pending
    状态)
  • 节点放大完成并经过一段时间(大约几分钟)后, HPA开始成功获取CPU指标,并尝试根据 公制
  • 当节点缩小时,也会出现同样的情况
  • 这会导致pod扩展停止,并导致响应客户端请求时出现一些故障。这正常吗

    我认为HPA应该在运行的pod上获得CPU指标(或其他指标),即使在节点扩展期间也是如此,以跟踪当前的最佳pod大小。因此,当节点扩展完成时,HPA会立即(而不是增量)创建必要的POD


    我可以让我的集群像这样工作吗?

    也许您的节点耗尽了内存或cpu中的一个资源,有一些配置映射描述了插件是如何根据集群大小进行缩放的。您需要在kube系统命名空间中编辑metrics服务器配置配置映射:

    kubectl edit cm/metrics-server-config -n kube-system
    
    你应该加上

    baseCPU
    cpuPerNode
    baseMemory
    memoryPerNode
    
    要查看配置,您可以找到详细的手册:

    此外,heapster还面临相同的OOM问题:太多的POD无法处理分配资源中的所有指标。请相应地修改heapster的配置映射:

    kubectl edit cm/heapster-config -n kube-system
    

    可能您的节点耗尽了一个资源(内存或cpu),有一些配置映射描述了如何根据集群大小扩展插件。您需要在kube系统命名空间中编辑metrics服务器配置配置映射:

    kubectl edit cm/metrics-server-config -n kube-system
    
    你应该加上

    baseCPU
    cpuPerNode
    baseMemory
    memoryPerNode
    
    要查看配置,您可以找到详细的手册:

    此外,heapster还面临相同的OOM问题:太多的POD无法处理分配资源中的所有指标。请相应地修改heapster的配置映射:

    kubectl edit cm/heapster-config -n kube-system
    

    我以前从未见过这个,所以这可能是一个有用的建议。我来看看这些地图。谢谢。我以前从未见过这个,所以这可能是一个有用的建议。我来看看这些地图。非常感谢。