Centos PBS-节点是空闲的,但它们不启动作业

Centos PBS-节点是空闲的,但它们不启动作业,centos,pbs,Centos,Pbs,我是PBS的新管理员。我下载并安装了torque-4.2.6version。我使用了torque.setup提供的默认配置 操作系统是带有内核2.6.18的CentOS 我关掉了所有的防火墙。我确认所有ssh/scp都在服务器和节点之间双向工作 配置之后,一切看起来都很好。少数工作完成得很好 当我提交10000份工作时,他们完成了大约70%的工作,但其余的没有开始工作。我发现server_priv/jobs目录包含这些作业 我检查了日志罚款。。。但是我找不到任何关于这个问题的线索 我使用df检查

我是PBS的新管理员。我下载并安装了
torque-4.2.6
version。我使用了torque.setup提供的默认配置

操作系统是带有
内核2.6.18的
CentOS

我关掉了所有的防火墙。我确认所有ssh/scp都在服务器和节点之间双向工作

配置之后,一切看起来都很好。少数工作完成得很好

当我提交10000份工作时,他们完成了大约70%的工作,但其余的没有开始工作。我发现server_priv/jobs目录包含这些作业

我检查了日志罚款。。。但是我找不到任何关于这个问题的线索

我使用
df
检查了磁盘空间,有10%(超过100GB)的可用空间,看起来足以运行PBS作业


在我检查其他事情之前,我向本网站的其他人寻求帮助

目前看来,这个问题太广泛了。对于其中一个“挂起”作业,请显示
qstat-f JOBID
打印的内容(将JOBID替换为作业的ID),感谢您的友好回答,尽管我的问题太宽泛了。我仍然不知道为什么少数工作(例如100项)正常完成,而大量工作(例如10000项)部分完成。对于大量的工作,pbs在早期工作正常,但在后期由于已知原因而停止。昨天,我发现通过[pbs_server restart]和[pbs_sched restart]重新启动pbs_服务器和pbs_sched可以简单地解决问题。因此,为了解决这个问题,我使用crontab定期执行restart命令。谢谢Je Hoon Song您使用的是什么计划程序?pbs_sched是默认的pbs计划程序。注:在我之前的评论中,“已知原因”应改为“未知原因”。对不起,打错了。谢谢。我建议您尝试使用毛伊岛而不是pbs_sched。虽然有一些人使用pbs_sched,但大多数人使用Maui,使用Maui更容易获得帮助。