Tensorflow 在Ubuntu 18.04 LTS服务器中。作业在完成之前过早死亡,即使在tmux或nohup中运行也是如此

Tensorflow 在Ubuntu 18.04 LTS服务器中。作业在完成之前过早死亡,即使在tmux或nohup中运行也是如此,tensorflow,deep-learning,ubuntu-18.04,Tensorflow,Deep Learning,Ubuntu 18.04,我面临着一个特殊的问题,我在tensorflow下运行一个执行深度学习模型培训的工作,而该工作在没有任何明显警告的情况下过早死亡。代码中没有语法错误,但运行它的作业在作业开始半小时后死亡。系统日志没有显示与我所面临的问题相关的任何内容,但我确实看到在我的作业失败前后,系统日志时间戳中存在很大的缺口 我通过ssh连接到Ubuntu 18.04 LTS服务器。即使我注销或保持与服务器的连接,我的工作也会在30-40分钟后终止。在我的作业失败前后,我在系统日志中始终看到的一件事是气流温度Cel警告 对

我面临着一个特殊的问题,我在tensorflow下运行一个执行深度学习模型培训的工作,而该工作在没有任何明显警告的情况下过早死亡。代码中没有语法错误,但运行它的作业在作业开始半小时后死亡。系统日志没有显示与我所面临的问题相关的任何内容,但我确实看到在我的作业失败前后,系统日志时间戳中存在很大的缺口

我通过ssh连接到Ubuntu 18.04 LTS服务器。即使我注销或保持与服务器的连接,我的工作也会在30-40分钟后终止。在我的作业失败前后,我在系统日志中始终看到的一件事是气流温度Cel警告

对于我所面临的这个奇怪的问题,我非常感谢任何帮助