使用GNU并行的qsub作业未运行

使用GNU并行的qsub作业未运行,qsub,Qsub,我正在尝试使用GNU并行在多节点(2)和PPN为20的情况下执行qsub作业,但它显示了一些错误 #!/bin/bash #PBS -l nodes=2:ppn=20 #PBS -l walltime=02:00:00 #PBS -N down cd $PBS_O_WORKDIR module load gnu-parallel for cdr in /scratch/data/v/mt/Downscale/*;do (cp /scratch/data/v/mt/DWN_FILE_NEW

我正在尝试使用GNU并行在多节点(2)和PPN为20的情况下执行qsub作业,但它显示了一些错误

#!/bin/bash
#PBS -l nodes=2:ppn=20
#PBS -l walltime=02:00:00
#PBS -N down

cd $PBS_O_WORKDIR
module load gnu-parallel

for cdr in /scratch/data/v/mt/Downscale/*;do
  (cp /scratch/data/v/mt/DWN_FILE_NEW/* $cdr/)
  (cd $cdr && parallel -j20 --sshloginfile $PBS_NODEFILE 'echo {} | ./vari_1st_imge' ::: *.DS0 )
done
当我运行上面的代码时,我得到了以下错误(请注意,所有路径都已正确检查,并且没有qsub的相同代码在正常计算机中正常运行)

&对于$qsub down,没有创建输出

我使用的是并行版本 GNU并行20140622

请帮助解决问题

首先尝试将
--dryrun
添加到
并行

但是我的感觉是由于某种原因,
$PBS\u NODEFILE
没有被设置,并且GNU Parallel试图将该命令读取为
--sshloginfile

要测试这一点:

echo $PBS_NODEFILE
(cd $cdr && parallel --sshloginfile $PBS_NODEFILE -j20 'echo {} | ./vari_1st_imge' ::: *.DS0 )

如果GNU Parallel现在尝试打开
-j20
,那么很明显它是空的。

感谢您的回复,我尝试了没有--sshloginfile$PBS\u NODEFILE的代码运行。你能建议我如何设置$PBS_NODEFILE吗。现在,当我尝试使用上述命令时,会显示错误:./down:line 14:module:command not found parallel:error:Cannot open echo{}}./vari_1st_imge。脚本找不到
parallel
二进制文件。验证它是否以及在节点上的位置(例如,运行交互式作业并搜索它,或者直接询问集群管理员),然后将完整路径放入二进制文件,或者将路径添加到脚本开头的
path
环境变量中。系统可能已经设置为将其包含在
模块
命令中。您的PBS管理员将知道未设置$PBS\u节点文件的原因。我本人从未使用过PBS系统,但我的印象是PBS通常自行设置此变量。
echo $PBS_NODEFILE
(cd $cdr && parallel --sshloginfile $PBS_NODEFILE -j20 'echo {} | ./vari_1st_imge' ::: *.DS0 )