Error handling 在作业崩溃后复制输出

Error handling 在作业崩溃后复制输出,error-handling,crash,cluster-computing,hpc,qsub,Error Handling,Crash,Cluster Computing,Hpc,Qsub,我在集群上运行了一个模拟。我提交作业时使用的qsub脚本如下 #PBS directives #function to copy data copy_data() ... stuff ... ./my_simulation copy_data 但是,如果模拟崩溃,则不会将输出复制回。如何处理可执行文件中的错误?一般来说,如何强制作业复制回数据?您可以尝试从以下内容开始: function handle_signals { echo "Signal caught! Cleaning!"

我在集群上运行了一个模拟。我提交作业时使用的
qsub
脚本如下

#PBS directives

#function to copy data
copy_data()

... stuff ...

./my_simulation
copy_data

但是,如果模拟崩溃,则不会将输出复制回。如何处理可执行文件中的错误?一般来说,如何强制作业复制回数据?

您可以尝试从以下内容开始:

function handle_signals {
  echo "Signal caught! Cleaning!"
  # do some stuff here
  echo "Done!"
}

trap handle_signals SIGTERM
trap handle_signals SIGSEGV