Module 删除本地lmod模块或更新HPC群集上的本地lmod模块列表
我正在HPC集群上工作。我成功地创建了本地openmpi_gpu模块(使用intel17.2和cuda 8.0编译)。我所做的是在目录中存储一个cuda_17.2.lua文件Module 删除本地lmod模块或更新HPC群集上的本地lmod模块列表,module,lua,hpc,Module,Lua,Hpc,我正在HPC集群上工作。我成功地创建了本地openmpi_gpu模块(使用intel17.2和cuda 8.0编译)。我所做的是在目录中存储一个cuda_17.2.lua文件 ${HOME}/modulefiles/Core/openmpi_gpu/ 之后 module use $HOME/modulefiles/Core 通过键入module avail,我可以看到新模块“openmpi\u gpu/cuda\u 17.2” 现在,我打算删除此模块,并将其替换为使用intel 17.2编译
${HOME}/modulefiles/Core/openmpi_gpu/
之后
module use $HOME/modulefiles/Core
通过键入module avail
,我可以看到新模块“openmpi\u gpu/cuda\u 17.2”
现在,我打算删除此模块,并将其替换为使用intel 17.2编译的新openmpi,而不使用cuda/8.0。因此,我rm-rf openmpi\u gpu
删除openmpi\u gpu的源文件,并仅使用intel 17.2重新编译openmpi。然后我删除目录${HOME}/modulefiles/Core/openmpi_gpu/
,并创建一个新目录${HOME}/modulefiles/Core/openmpi_intel/
,以存储新的.lua文件local_17.2.lua
但是,现在我尝试了module avail
,但仍然可以看到旧模块“openmpi\u gpu/cuda\u 17.2”,而看不到新模块“openmpi/local\u 17.2”
我怀疑我不应该仅仅通过删除源文件来删除模块,或者我应该做些事情来更新模块列表。不管怎样,有人知道这个问题吗?提前感谢您。Lmod使用的是缓存,因此您可能只是看到了缓存,而缓存尚未更新。运行以下命令将其重置:
rm -rf ~/.lmod.d/.cache
或者,您可以使用--ignore_cache
选项:
module --ignore_cache avail