Error handling 在作业崩溃后复制输出
我在集群上运行了一个模拟。我提交作业时使用的Error handling 在作业崩溃后复制输出,error-handling,crash,cluster-computing,hpc,qsub,Error Handling,Crash,Cluster Computing,Hpc,Qsub,我在集群上运行了一个模拟。我提交作业时使用的qsub脚本如下 #PBS directives #function to copy data copy_data() ... stuff ... ./my_simulation copy_data 但是,如果模拟崩溃,则不会将输出复制回。如何处理可执行文件中的错误?一般来说,如何强制作业复制回数据?您可以尝试从以下内容开始: function handle_signals { echo "Signal caught! Cleaning!"
qsub
脚本如下
#PBS directives
#function to copy data
copy_data()
... stuff ...
./my_simulation
copy_data
但是,如果模拟崩溃,则不会将输出复制回。如何处理可执行文件中的错误?一般来说,如何强制作业复制回数据?您可以尝试从以下内容开始:
function handle_signals {
echo "Signal caught! Cleaning!"
# do some stuff here
echo "Done!"
}
trap handle_signals SIGTERM
trap handle_signals SIGSEGV