Performance 为什么GKE节点在没有POD的情况下在开始时平均负载如此之高？_Performance_Kubernetes_Virtual Machine_Google Kubernetes Engine

Performance 为什么GKE节点在没有POD的情况下在开始时平均负载如此之高？

performance kubernetes virtual-machine

Performance 为什么GKE节点在没有POD的情况下在开始时平均负载如此之高？,performance,kubernetes,virtual-machine,google-kubernetes-engine,Performance,Kubernetes,Virtual Machine,Google Kubernetes Engine,我们有一个带有3个节点的小GKE云（2个节点n1-s1和另一个节点n1-s2），让我们调用它们（a、B和C），运行版本“v1.14.10-GKE.27” 昨天，在MySQL POD出现性能问题后，我们开始挖掘问题的原因，并发现虚拟机节点（a）和（B）的平均负载较高。。。（C）在之后创建，以便将DB pod移到内部在我们的检查（kubectl top nodes）和（kubectl-n MYNAMESPACE top pods）中，我们发现节点中使用的CPU/内存是中等的，大约60%的CPU和

我们有一个带有3个节点的小GKE云（2个节点n1-s1和另一个节点n1-s2），让我们调用它们（a、B和C），运行版本“v1.14.10-GKE.27” 昨天，在MySQL POD出现性能问题后，我们开始挖掘问题的原因，并发现虚拟机节点（a）和（B）的平均负载较高。。。（C）在之后创建，以便将DB pod移到内部

在我们的检查（kubectl top nodes）和（kubectl-n MYNAMESPACE top pods）中，我们发现节点中使用的CPU/内存是中等的，大约60%的CPU和70%的内存

好的，我们做了这个测试。我们排空节点A并重新启动虚拟机。通过这样做：

kubectl drain --ignore-daemonsets
gcloud compute ssh A
sudo reboot

重新启动虚拟机节点（A）并等待大约15分钟后，我们再次连接，并看到以下情况：

gcloud compute ssh A
top

显示大约1.0（0.9-1.2）的平均负载。。。但这台机器（1核和3.5GB内存）内部没有吊舱。我检查了机器大约30分钟，GKE的核心linux系统的平均负载总是接近1.0

为什么?

然后我又做了一次检查。在节点（B）中，只有一个SFTP服务器（CPU使用量约为3毫秒）。我做了同样的测试：

gcloud compute ssh B
top

这表明：

top - 19:02:48 up 45 days,  4:40,  1 user,  load average: 1.00, 1.04, 1.09

Tasks: 130 total,   1 running, 129 sleeping,   0 stopped,   0 zombie
%Cpu(s):  3.4 us,  1.3 sy,  0.0 ni, 95.3 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem :   3697.9 total,   1383.6 free,    626.3 used,   1688.1 buff/cache
MiB Swap:      0.0 total,      0.0 free,      0.0 used.   2840.3 avail Mem
    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
   1065 root      20   0  924936 117608  66164 S   1.7   3.1   1356:05 kubelet
   1932 root      20   0  768776  82748  11676 S   1.0   2.2 382:32.65 ruby
   1008 root      20   0  806080  90408  26644 S   0.7   2.4 818:40.25 dockerd
    183 root      20   0       0      0      0 S   0.3   0.0   0:26.09 jbd2/sda1-8
      1 root      20   0  164932   7212   4904 S   0.0   0.2  17:47.38 systemd
      2 root      20   0       0      0      0 S   0.0   0.0   0:00.09 kthreadd
      4 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 kworker/0:0H
      6 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 mm_percpu_wq

但是：

CPU使用寿命仅为1m，RAM为11MB

为什么平均负载如此之高

我担心这一点，因此这种平均负载可能会影响集群节点中的POD的性能

另一方面，我在office安装了一个测试用的kubernetes集群，其中包含Debian VM节点和一个节点（2核4 GB RAM），但运行了Zammad和Jira的POD，显示了这个平均负载：库伯内特斯云办公室

ssh user@node02
top

top - 21:11:29 up 17 days,  6:04,  1 user,  load average: 0,21, 0,37, 0,21
Tasks: 161 total,   2 running, 159 sleeping,   0 stopped,   0 zombie
%Cpu(s):  2,4 us,  1,0 sy,  0,0 ni, 96,3 id,  0,3 wa,  0,0 hi,  0,0 si,  0,0 st
MiB Mem :   3946,8 total,    213,4 free,   3249,4 used,    483,9 buff/cache
MiB Swap:      0,0 total,      0,0 free,      0,0 used.    418,9 avail Mem

在Office的节点上，平均负载、运行吊舱约为0.21-0.4。。。。这是更现实的，类似于它的预期

另一个问题是，当我通过ssh连接到GKE节点（A、B或C）时，没有像iostat和similar这样的工具来监控硬驱动程序/存储，所以我不知道为什么基本KDE节点的平均负载如此之高，没有调度pod

今天，在关键时刻，这是GKE云状态：

kubectl top nodes
NAME         CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%
gke-n1-s1-A   241m         25%    1149Mi          43%
gke-n1-s1-B   81m          8%     1261Mi          47%
gke-n1-s2-C   411m         21%    1609Mi          28%

但节点B中的顶部显示

top - 11:20:46 up 45 days, 20:58,  1 user,  load average: 1.66, 1.25, 1.13
Tasks: 128 total,   1 running, 127 sleeping,   0 stopped,   0 zombie
%Cpu(s):  6.0 us,  2.3 sy,  0.0 ni, 91.6 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem :   3697.9 total,   1367.8 free,    629.6 used,   1700.6 buff/cache
MiB Swap:      0.0 total,      0.0 free,      0.0 used.   2837.7 avail Mem

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
   1065 root      20   0  924936 117608  66164 S   3.3   3.1   1376:27 kubelet
   1008 root      20   0  806080  90228  26644 S   1.3   2.4 829:21.65 dockerd
2590758 root      20   0  136340  29056  20908 S   0.7   0.8  18:38.56 kube-dns
    443 root      20   0   36200  19736   5808 S   0.3   0.5   3:51.49 google_accounts
   1932 root      20   0  764164  82748  11676 S   0.3   2.2 387:52.03 ruby
      1 root      20   0  164932   7212   4904 S   0.0   0.2  18:03.44 systemd
      2 root      20   0       0      0      0 S   0.0   0.0   0:00.09 kthreadd
      4 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 kworker/0:0H
      6 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 mm_percpu_wq
      7 root      20   0       0      0      0 S   0.0   0.0  14:55.03 ksoftirqd/0

编辑1：最后一次测试：