Kubernetes POD开始处于挂起状态的时间太长

Kubernetes POD开始处于挂起状态的时间太长,kubernetes,google-cloud-platform,cluster-computing,Kubernetes,Google Cloud Platform,Cluster Computing,我有一个集群,其中作业是按照用户的操作顺序创建的。 有时我可以有0个工作并行,有时20到100。 我为每个容器设置了以下限制: cpu limit: 512m memory limit: 512Mi; cpu request: 256m; memroy request: 128Mi; 默认情况下,我有2个节点,每个节点都有: 7.91 CPU allocable 10.16 GB allocable 节点池最多可以扩展到5个节点 但当集群开始有8个或更多并行作业时,新作业开始处于挂起状态,等

我有一个集群,其中作业是按照用户的操作顺序创建的。 有时我可以有0个工作并行,有时20到100。 我为每个容器设置了以下限制:

cpu limit: 512m
memory limit: 512Mi;
cpu request: 256m;
memroy request: 128Mi;
默认情况下,我有2个节点,每个节点都有:

7.91 CPU allocable
10.16 GB allocable
节点池最多可以扩展到5个节点

但当集群开始有8个或更多并行作业时,新作业开始处于挂起状态,等待其他作业停止。 如果选择直接启动作业,则该作业将在6到7秒内完成。 但是当集群从8个或10个作业开始挣扎时,每个作业大约需要20秒才能完成,因为它在挂起状态或容器创建状态下被阻塞

我有IfNotPresent作为imagePullPolicy,每个图像都有一个版本

我假设集群将开始在知道我的可分配资源的情况下处理28个作业,然后创建一个新节点,以此类推。 为什么我错了? 是否可以强制每个容器在没有挂起状态的情况下启动?
我找到了一个新的调度程序,但我不确定它是否能帮助我使用波塞冬苍穹备用调度程序?

这些吊舱的imagePullPolicy是否设置为“始终”?您是否正在使用
最新的
标记?您是否为每个作业运行使用不同的映像?如果您对其中任何一个问题的回答都是肯定的,则可能是由于网络瓶颈造成的问题。@HelloWorld我以imagePullPolicy的形式呈现,并且每个图像都有一个版本,因此,这并不是每次都要提取图像。你能详细描述一下如何复制你的问题吗?用一个运行javac和java的容器启动N个作业,用一个类大致打印5件事情,利用我之前提供的资源,你可以用随机时间(0到5秒)来分离每个作业的创建我忘了提到,但每个作业都会装载一个configMap。但是从来没有遇到过这样的问题:由于缺少configMap,无法创建作业。我认为这不是计划问题。我试着像你说的那样在同一时间安排许多工作,调度程序没有问题。问题一定在别的地方。