Bash sge只能在一个节点中运行一个任务

Bash sge只能在一个节点中运行一个任务,bash,shell,cluster-computing,centos7,sungridengine,Bash,Shell,Cluster Computing,Centos7,Sungridengine,我在一个四节点集群中构建了SGE以获取源代码。Centos7中的操作系统。当我在集群中提交一些简单的任务时,我发现只有一个任务在一个节点中运行。有什么问题吗?这是我的任务代码: sleep 60 echo "done" 这是我提交任务的cmd: DIR=`pwd` option="" for((i=0;i<5;i++));do qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.s

我在一个四节点集群中构建了SGE以获取源代码。Centos7中的操作系统。当我在集群中提交一些简单的任务时,我发现只有一个任务在一个节点中运行。有什么问题吗?这是我的任务代码:

sleep 60
echo "done"
这是我提交任务的cmd:

DIR=`pwd`
option=""
for((i=0;i<5;i++));do
  qsub -q multislots $option -V -cwd -o stdout -e stderr -S /bin/bash $DIR/test.sh
  sleep 1
done
DIR=`pwd`
option=“”

对于((i=0;i给出了由于“找不到未使用的add_grp_id”而导致作业失败的错误消息)。您应该检查sge配置中设置的gid_范围(包括全局范围和每个主机是否有一个)。它应该是其他未使用的组id的范围。在一个节点上,至少有您想要的作业的gid


如果不是这样,请尝试在其中一个排队作业上运行qalter-w v和qalter-w p,以查看它们没有启动的原因。

在屏幕截图上,我看到3个作业在3个节点上运行(如果我没有弄错的话,作业505在node332上,作业506在node335上,作业504 node336)你怎么说在一个节点上运行一个任务?我的意思是node335有16个插槽,而job506只使用一个,队列中有两个作业在等待,为什么剩下的两个作业没有运行?当我查看文件default/spool/qmaster/messages时,我看到了错误:“作业519.1在作业之前的主机节点332上失败,因为:找不到未使用的add\u grp\u id”