Kubernetes 未能垃圾收集所需数量的图像。想要释放6283487641字节,但释放了0字节

Kubernetes 未能垃圾收集所需数量的图像。想要释放6283487641字节,但释放了0字节,kubernetes,amazon-ec2,nodes,amazon-eks,eksctl,Kubernetes,Amazon Ec2,Nodes,Amazon Eks,Eksctl,我搜索了很多网站和文章,但没有找到任何完美的答案。我正在使用eks 1.18版。我可以看到一些POD被“逐出”,但在尝试检查节点时,我可以看到错误(来自类似事件):未能垃圾收集所需数量的图像。希望释放6283487641字节,但释放了0字节” 我们能找到失败的原因吗?或者如何解决这个问题?欢迎提出任何建议 我可以看到磁盘“覆盖”文件系统在几个小时内几乎已满。我不知道发生了什么事。下面的屏幕截图显示了我的内存利用率 查看是否可以更改Kubernetes GC策略。 我想问题可能是由于最近旗帜的变

我搜索了很多网站和文章,但没有找到任何完美的答案。我正在使用eks 1.18版。我可以看到一些POD被“逐出”,但在尝试检查节点时,我可以看到错误(来自类似事件):未能垃圾收集所需数量的图像。希望释放6283487641字节,但释放了0字节”

我们能找到失败的原因吗?或者如何解决这个问题?欢迎提出任何建议

我可以看到磁盘“覆盖”文件系统在几个小时内几乎已满。我不知道发生了什么事。下面的屏幕截图显示了我的内存利用率


查看是否可以更改Kubernetes GC策略。 我想问题可能是由于最近旗帜的变化

新版本使用的标志是
--execution
语法,您能否检查您的设置是否会导致清除空间失败

请参阅此处的文档


由于您没有提供您的信息的任何上下文,因此很难提供任何建议。查看描述的类似问题,这可能与节点磁盘压力或某些ebs存储有关。谢谢,Thomas。实际上,我有5个节点在EKS上运行。每个节点包含大约10-12个吊舱,但是当我检查节点时,我可以看到上面的错误。而且,几天后我发现有很多被驱逐的豆荚。似乎是内存问题,事件似乎是“FreeDiskSpaceFailed”。如果你正在寻找任何特定的配置共享,请让我知道。你删除了被驱逐的豆荚吗?你查过库贝莱日志了吗?可能有一些关于删除失败原因的信息。我已删除了已收回的播客。哪些日志,有什么特定的日志或位置要看吗?你有很多日志记录吗?您的容器日志(例如docker日志)可能会占用大量空间,如果是这种情况,我曾经看到过这种情况,所以我会检查以确保安全。如果根磁盘有压力,POD将被逐出到可用空间,以尝试在达到完全故障(总磁盘空间被占用)之前进行恢复。