Kubernetes POD开始处于挂起状态的时间太长_Kubernetes_Google Cloud Platform_Cluster Computing

Kubernetes POD开始处于挂起状态的时间太长

kubernetes google-cloud-platform cluster-computing

Kubernetes POD开始处于挂起状态的时间太长,kubernetes,google-cloud-platform,cluster-computing,Kubernetes,Google Cloud Platform,Cluster Computing,我有一个集群，其中作业是按照用户的操作顺序创建的。有时我可以有0个工作并行，有时20到100。我为每个容器设置了以下限制： cpu limit: 512m memory limit: 512Mi; cpu request: 256m; memroy request: 128Mi; 默认情况下，我有2个节点，每个节点都有： 7.91 CPU allocable 10.16 GB allocable 节点池最多可以扩展到5个节点但当集群开始有8个或更多并行作业时，新作业开始处于挂起状态，等

我有一个集群，其中作业是按照用户的操作顺序创建的。有时我可以有0个工作并行，有时20到100。我为每个容器设置了以下限制：

cpu limit: 512m
memory limit: 512Mi;
cpu request: 256m;
memroy request: 128Mi;

默认情况下，我有2个节点，每个节点都有：

7.91 CPU allocable
10.16 GB allocable

节点池最多可以扩展到5个节点

但当集群开始有8个或更多并行作业时，新作业开始处于挂起状态，等待其他作业停止。如果选择直接启动作业，则该作业将在6到7秒内完成。但是当集群从8个或10个作业开始挣扎时，每个作业大约需要20秒才能完成，因为它在挂起状态或容器创建状态下被阻塞

我有IfNotPresent作为imagePullPolicy，每个图像都有一个版本

我假设集群将开始在知道我的可分配资源的情况下处理28个作业，然后创建一个新节点，以此类推。为什么我错了？是否可以强制每个容器在没有挂起状态的情况下启动？

我找到了一个新的调度程序，但我不确定它是否能帮助我使用波塞冬苍穹备用调度程序？

这些吊舱的imagePullPolicy是否设置为“始终”？您是否正在使用

最新的标记？您是否为每个作业运行使用不同的映像？如果您对其中任何一个问题的回答都是肯定的，则可能是由于网络瓶颈造成的问题。@HelloWorld我以imagePullPolicy的形式呈现，并且每个图像都有一个版本，因此，这并不是每次都要提取图像。你能详细描述一下如何复制你的问题吗？用一个运行javac和java的容器启动N个作业，用一个类大致打印5件事情，利用我之前提供的资源，你可以用随机时间（0到5秒）来分离每个作业的创建我忘了提到，但每个作业都会装载一个configMap。但是从来没有遇到过这样的问题：由于缺少configMap，无法创建作业。我认为这不是计划问题。我试着像你说的那样在同一时间安排许多工作，调度程序没有问题。问题一定在别的地方。