Kubernetes节点磁盘IO和CPU使用率高

Kubernetes节点磁盘IO和CPU使用率高,kubernetes,disk-io,kubelet,kops,Kubernetes,Disk Io,Kubelet,Kops,我使用1.5.2版运行Kubernetes群集,在AWS上使用Kops进行设置。该设置没有任何异国情调。我的节点在m4.xlarge上运行,磁盘存储容量为70 Gb,iops为1000 我有一段时间,我的一些节点会因为iops而变得疯狂。以下是我看到的: 所以你把我所有的iops都放在docker overlay目录中。以下是kubelet日志显示的内容: fsHandler.go:131] du and find on following dirs took 4.22914425s: [/v

我使用1.5.2版运行Kubernetes群集,在AWS上使用Kops进行设置。该设置没有任何异国情调。我的节点在
m4.xlarge
上运行,磁盘存储容量为70 Gb,iops为1000

我有一段时间,我的一些节点会因为iops而变得疯狂。以下是我看到的:

所以你把我所有的iops都放在docker overlay目录中。以下是kubelet日志显示的内容:

fsHandler.go:131] du and find on following dirs took 4.22914425s: [/var/lib/docker/overlay/592c1d88d1fd115f21e8fe6f198a8a27cd44efefb9b5dc58940fbf6d7999eda3 /var/lib/docker/containers/2347d28886bc0e6b74fc326538e1483927ddeb89b38e035acd845d5db621cb79]
fsHandler.go:131] du and find on following dirs took 24.94283434s: [/var/lib/docker/overlay/81f24df3624ebf7b7e45edc38fafeb41958bc675ae57fd0126c44cb2c3a6d6d6 /var/lib/docker/containers/43d576931081500fd4cd316afe5bfc6ff2442ff20e8e8266c27e930a0a77dd34]
fsHandler.go:131] du and find on following dirs took 18.478782737s: [/var/lib/docker/overlay/422ef31413df4e76de51acaa7d6ff6f77edc65fabde88a7c70e7edad3b1e55e5 /var/lib/docker/containers/1519a33729c8fb13297358edc53fe22f0b4b684636884976dfcb67c47fbf320b]
helpers.go:101] Unable to get network stats from pid 13515: couldn't read network stats: failure opening /proc/13515/net/dev: open /proc/13515/net/dev: no such file or directory
fsHandler.go:131] du and find on following dirs took 7.971745844s: [/var/lib/docker/overlay/45b83939bd1b4ec7dfa627bb6a9eb8b89a380007f9e22a93fff2ba4054252271 /var/lib/docker/containers/f6d3387423398d7dd4fac6c19ee0a1446d0465b5f9cf90289fcd605ad28c0d6e]
fsHandler.go:131] du and find on following dirs took 5.886763577s: [/var/lib/docker/overlay/8c01a73671eedb2e62c58fa12fc2d25df58c506545b6ea048fa0db1756d19f2c /var/lib/docker/containers/1d9c0ebcc6dbbd7065923f7f81c05c0d9d710aed0d353a1bab90ce1c994dfb57]
fsHandler.go:131] du and find on following dirs took 5.714942029s: [/var/lib/docker/overlay/26213ba30a17f240a9b9756a0d23ab32550f921de533667c9ab91cfb7f10ed5b /var/lib/docker/containers/7c27c242a49d8d33cee8b2e8335dae450af13b26f010794dc83ef5750a212d0d]
fsHandler.go:131] du and find on following dirs took 6.111478835s: [/var/lib/docker/overlay/0fe2bd0feeda24699bd6d443ca126ac1a33071cdff039ae9fd9159bbef80867b /var/lib/docker/containers/ec6fb966139e9666ec0be5e13399773f1971ddd99841b84167a7463402e28d73]
fsHandler.go:131] du and find on following dirs took 2.661604836s: [/var/lib/docker/overlay/04f9d01a8863cfee26e678e938fced84f826dda6ed03626dda11b6aad6901465 /var/lib/docker/containers/a4e37aee69c7523c46c5252c1834fa3fcd5a804a7aee256a468e44b4d6bcbd64]
fsHandler.go:131] du and find on following dirs took 11.834409809s: [/var/lib/docker/overlay/4cb1476621b90e2c2ee2b1131c0e6ac62f62dc3ca418129812b487bffac1d827 /var/lib/docker/containers/5a01521cfdd3041aff128dce7353ab336ddafa60c8c0b2254fb6bae697cb1676]

我建议升级到k8s版本1.6,变更日志中记录了许多更新,这些更新应有助于调试您的问题


通常,EBS卷在IO方面不完全可用,除非您通过读取和写入设备上的每个块来对其进行完全“预热”。

我建议升级到k8s 1.6版,更改日志中记录了许多更新,这些更新应有助于调试您的问题


通常情况下,EBS卷在IO方面不完全可用,除非您通过读取和写入设备上的每个数据块来对其进行完全“预热”。

是否有大量容器/存储舱启动后立即停止?当你的容器启动失败,编排一直在重复时,我看到过这种情况。我的所有播客都运行了5天以上。所以看起来不是因为吊舱重启。加上我只有长时间运行的过程
iotop
不断向我展示像du-s/var/lib/docker/overlay/DIGEST这样的流程。是否有很多容器/吊舱开始运行,然后立即停止?当你的容器启动失败,编排一直在重复时,我看到过这种情况。我的所有播客都运行了5天以上。所以看起来不是因为吊舱重启。加上我只有长时间运行的过程
iotop
不断向我展示像du-s/var/lib/docker/overlay/DIGEST这样的流程。我一直在运行kubernetes 1.7,我自己也看到了同样的问题。在我的例子中,我有一个大容器(每个大小约2GB),所以我可以理解为什么du需要这么长时间。但看起来这个过程大约每分钟运行一次。我一直在运行kubernetes 1.7,我自己也看到了同样的问题。在我的例子中,我有一个大容器(每个大小约2GB),所以我可以理解为什么du需要这么长时间。但看起来这个过程大约每分钟运行一次。