Parallel processing 使用和不使用rankfile跑步的区别

Parallel processing 使用和不使用rankfile跑步的区别,parallel-processing,mpi,openmpi,Parallel Processing,Mpi,Openmpi,我用mpirun-np 23-rf rankfile--hostfile hostfile./MPI_testing启动我的MPI程序,它会暂停,也就是说:它卡住了,但当我用mpirun-np 23./MPI_testing启动它时,它工作得非常好。我相信我的rankfile或hostfile没有问题。在这种情况下,我的MPI代码是否存在特定的问题,或者是否存在有关MPI运行的外部问题 更新:我的机器上有16芯,两个插座,每个插座有8芯 主机文件 localhost 兰克菲尔 rank 0=l

我用
mpirun-np 23-rf rankfile--hostfile hostfile./MPI_testing
启动我的MPI程序,它会暂停,也就是说:它卡住了,但当我用
mpirun-np 23./MPI_testing
启动它时,它工作得非常好。我相信我的rankfile或hostfile没有问题。在这种情况下,我的MPI代码是否存在特定的问题,或者是否存在有关MPI运行的外部问题

更新:我的机器上有16芯,两个插座,每个插座有8芯

主机文件

localhost
兰克菲尔

rank 0=localhost slot=0:0
rank 1=localhost slot=0:1
rank 2=localhost slot=0:2
rank 3=localhost slot=0:3
rank 4=localhost slot=0:4
rank 5=localhost slot=0:5
rank 6=localhost slot=0:6
rank 7=localhost slot=0:7
rank 8=localhost slot=1:0
rank 9=localhost slot=1:1
rank 10=localhost slot=1:2
rank 11=localhost slot=1:3
rank 12=localhost slot=1:4
rank 13=localhost slot=1:5
rank 14=localhost slot=1:6
rank 15=localhost slot=1:7
rank 16=localhost slot=0:1
rank 17=localhost slot=0:2
rank 18=localhost slot=0:3
rank 19=localhost slot=0:4
rank 20=localhost slot=0:5
rank 21=localhost slot=0:6
rank 22=localhost slot=0:7

我使用
--报告绑定
选项检查了绑定,因此这是正确的。这很可能是网络问题。在没有
--hostfile
的情况下运行会启动本地主机上的所有进程,因此不会出现网络问题。在任何情况下,考虑到(缺少)提供的详细信息,我怀疑是否有人能回答您的问题。我正在本地主机上运行它,因此绝对不是网络问题。我只是想知道是否存在一般性问题,因为根据我的理解,rankfile只将进程映射到核心,而这对于实际代码的运行是无关紧要的。是否要显示
hostfile
rankfile
的内容?