Parallel processing 我的工作消失得无影无踪

Parallel processing 我的工作消失得无影无踪,parallel-processing,mpi,hpc,qsub,Parallel Processing,Mpi,Hpc,Qsub,我正在运行一个天气预报模型,我想通过crontab自动运行modek。当我通过以下方式提交我的工作时: qsub -I -l nodes=8:ppn=8 -l walltime=2:00:00 作业运行正常。 当我通过crontab提交时,作业将消失,没有任何跟踪,任何位置都没有错误文件,没有输出文件,邮件除外,其内容如下: From: root@master.cluster (Cron Daemon) To: test@master.cluster Subject: Cron <tes

我正在运行一个天气预报模型,我想通过crontab自动运行modek。当我通过以下方式提交我的工作时:

qsub -I -l nodes=8:ppn=8 -l walltime=2:00:00
作业运行正常。 当我通过crontab提交时,作业将消失,没有任何跟踪,任何位置都没有错误文件,没有输出文件,邮件除外,其内容如下:

From: root@master.cluster (Cron Daemon)
To: test@master.cluster
Subject: Cron <test@master> PATH=/opt/torque/bin:/usr/bin:/bin:. qsub /home/test
/WRF/SCRIPTS/wrf_00_run.sh
Content-Type: text/plain; charset=UTF-8
Auto-Submitted: auto-generated
X-Cron-Env: <SHELL=/bin/sh>
X-Cron-Env: <HOME=/home/test>
X-Cron-Env: <PATH=/usr/bin:/bin>
X-Cron-Env: <LOGNAME=test>
X-Cron-Env: <USER=test>
Message-Id: <20141220080001.D0F6B5C08ED@master.cluster>
Date: Sat, 20 Dec 2014 10:00:01 +0200 (CAT)
152.master.cluster
wrf_submit_00.sh有两个连续运行的从属作业

#!/bin/bash
cd WRF/WRFV3/run

FIRST =`qsub wrf_initialise.sh`
echo $FIRST
SECOND = `qsub -w depend=afterok:$FIRST wrf_00_run.sh`
echo $SECOND
exit 0
第一项工作是

#!/bin/bash
#PBS -l nodes=8:ppn=8
cd WRF/WRFV3/run
echo -n "this script is running on: "
hostname -f
date
echo ""
echo "### PBS_NODEFILE (${PBS_NODEFILE}) ###"
cat ${PBS_NODEFILE}
echo ""
mpirun ./real.exe
exit 0
当我通过crontab分别提交这两个作业时,我得到了相同的结果。
请帮忙!,我卡住了。谷歌搜索类似问题时,我没有任何线索。

您可能希望在cron作业中添加一些额外的调试行。cron环境可能非常不同,以至于找不到可执行文件或其他奇怪的东西。可能是“echo$PATH”或“qstat-f$FIRST”来看看发生了什么。谢谢@chuck,我正在尝试这些建议和我能想到的其他建议。您对尝试路径的指示非常有用。为什么要通过
qsub
运行
wrf\u submit\u 00.sh
?您可能应该直接执行它,即从crontab中的行中删除
qsub
#!/bin/bash
#PBS -l nodes=8:ppn=8
cd WRF/WRFV3/run
echo -n "this script is running on: "
hostname -f
date
echo ""
echo "### PBS_NODEFILE (${PBS_NODEFILE}) ###"
cat ${PBS_NODEFILE}
echo ""
mpirun ./real.exe
exit 0