如何在python中重置CUDA GPU

如何在python中重置CUDA GPU,python,pytorch,gpu,Python,Pytorch,Gpu,有没有办法在python中重新启动CUDA GPU?或者释放它以便其他脚本可以访问它 我有时会在python中使用GPU时出错,而再次访问GPU的唯一解决方案是重新启动我的Jupyter笔记本 PS:我正在使用GPU进行一些使用pytorch的计算 我得到的具体错误是: RuntimeError: CUDA error: device-side assert triggered 我见过很多人讨论这个问题。我的主要问题是如何在不重新启动Jupyter内核的情况下继续使用GPU会话 i、 e.我想

有没有办法在python中重新启动CUDA GPU?或者释放它以便其他脚本可以访问它

我有时会在python中使用GPU时出错,而再次访问GPU的唯一解决方案是重新启动我的Jupyter笔记本

PS:我正在使用GPU进行一些使用pytorch的计算

我得到的具体错误是:

RuntimeError: CUDA error: device-side assert triggered
我见过很多人讨论这个问题。我的主要问题是如何在不重新启动Jupyter内核的情况下继续使用GPU会话

i、 e.我想抓住这个错误,我用try/except做了这个错误,然后继续,因为我正在一个接一个地训练多个模型,所以我无法重新开始解决我的问题

编辑重新启动内核似乎是公认的简单解决方案请参见:

-
-她提到“在Kaggle上工作?这就是为什么即使完成了上述步骤,你仍在挣扎”

你能详细说明错误是什么吗?@AdarshC我确实这么做了,但是错误本身并不是我的主要问题,因为我也提到了
torch.cuda.empty_cache()
torch.cuda.ipc_collect()
不工作?@SzymonMaszke
torch.cuda.empty_cache()
不运行,它给出了完全相同的错误。和
torch.cuda.ipc_collect()
运行,但在尝试训练时,它再次出现相同的错误不要使用Jupyter笔记本。使用简单的.py脚本。它不允许cuda在会话结束后释放资源,这会产生问题。您能详细说明错误是什么吗?@AdarshC我确实这么做了,但是错误本身并不是我的主要问题,因为我还注意到
torch.cuda.empty_cache()
torch.cuda.ipc_collect()
不工作?@SzymonMaszke
torch.cuda.empty_cache()
不运行,它给出了完全相同的错误。和
torch.cuda.ipc_collect()
运行,但在尝试训练时,它再次出现相同的错误不要使用Jupyter笔记本。使用简单的.py脚本。它不允许cuda在会话结束后释放资源,这会造成问题。