Linux 如何在“mpirun”的命令行中指定节点?

Linux 如何在“mpirun”的命令行中指定节点?,linux,mpi,Linux,Mpi,如何使用mpirun的-machine标志 为了选择要在哪个集群节点上执行,我决定使用mpirun的-machinefile选项,如下所示 > mpirun -machinefile $HOME/utils/Host_file -np <integer> <executable-filename> 我可以使用-machine标志,然后为每次执行键入不同的节点。但我不能让它工作。比如说 > mpirun -machine node21-ib -np 1 FPU

如何使用mpirun的-machine标志

为了选择要在哪个集群节点上执行,我决定使用mpirun的-machinefile选项,如下所示

> mpirun -machinefile $HOME/utils/Host_file -np <integer> <executable-filename>
我可以使用-machine标志,然后为每次执行键入不同的节点。但我不能让它工作。比如说

> mpirun -machine node21-ib -np 1 FPU
> mpirun -machine node21 -np 1 FPU
始终在主节点上执行

我还尝试了-nodes选项

但这只是在我当前的节点上执行

类似地,我尝试了-nolocal和-exclude选项,但没有成功

所以我有一个简单的问题:如何使用机器选项?或者对于Linux新手来说,有没有更好的方法

我正在使用以下版本的MPI,到目前为止,它在web上的文档似乎少得出奇,我所有的文档都来自>mpirun-help


谢谢您的帮助。

您需要的是指定一个主机文件

例如,在mpirun命令中,尝试mpirun-np 4-hostfile hosts./exec


如果主机包含您的ip地址,通常为192.168.1.201:8,其中最后一位数字是最大的核心数,请用换行符分隔每个节点。理想情况下,您应该安装一些群集管理软件,例如torque和maui。

您的群集不是在SGE、LSF、torque等资源管理器的控制下运行吗?这些通常提供与MPI实现集成的方法,以自动为每个作业提供正确的节点文件。我不知道什么是SGE、LSF或Torque。我怀疑我们有这些东西。集群是一个简单的集群,由一位不是计算机专家的数学教授拥有和管理。所有者告诉我torque已安装,但未激活。pyC,恐怕我一点也不明白你的答案,甚至连一个好问题都问不上来。我已经有了-machinefile,它有一个节点列表,听起来和你建议的类似。此外,mpirun-help不显示任何-hostfile选项,也没有man-mpirun条目。我尝试了mpirun-np 4-hostfile$HOME/utils/Host\u file./exec,但它的运行方式与mpirun-np 4-machinefile$HOME/utils/Host\u file./exec的运行方式完全相同。你能补充一些细节吗?
> mpirun -machine node21-ib -np 1 FPU
> mpirun -machine node21 -np 1 FPU
> mpirun -nodes node21-ib -np 1 FPU
> mpirun -nodes node21 -np 1 FPU
> mpichversion
MPICH Version:          1.2.7
MPICH Release date:     $Date: 2005/06/22 16:33:49$
MPICH Patches applied:  none
MPICH configure:        --with-device=ch_gen2 --with-arch=LINUX -prefix=/usr/local/mvapich-gcc --with-romio --without-mpe -lib=-L/usr/lib64 -Wl,-rpath=/usr/lib64 -libverbs -libumad -lpthread
MPICH Device:           ch_gen2