开放MPI:在超额订阅时使用绑定到核心
我的问题是,当超额订阅时,是否可以使用开放MPI:在超额订阅时使用绑定到核心,mpi,openmpi,Mpi,Openmpi,我的问题是,当超额订阅时,是否可以使用--bind to core标志?我正在使用OpenMPI版本1.5.4,并尝试以2的系数(16核上的32个进程)超额订阅,使用: 但它返回了一个错误: 32 total processes failed to start 然而,如果我不使用——绑定到核心,一切都可以正常工作。这里有什么问题?可以解决吗?-npersocket选项激活了--绑定到套接字,这与--绑定到内核冲突。您可能可以通过编写一个rankfile来解决这个问题—非常类似于主机文件,但它还
--bind to core
标志?我正在使用OpenMPI版本1.5.4,并尝试以2的系数(16核上的32个进程)超额订阅,使用:
但它返回了一个错误:
32 total processes failed to start
然而,如果我不使用
——绑定到核心,一切都可以正常工作。这里有什么问题?可以解决吗?-npersocket
选项激活了--绑定到套接字
,这与--绑定到内核
冲突。您可能可以通过编写一个rankfile来解决这个问题—非常类似于主机文件,但它还包含每个列组的绑定信息。例如,要将4个进程绑定到主机localhost
上的2个核心,可以使用以下rankfile:
rank 0=localhost slot=0
rank 1=localhost slot=0
rank 2=localhost slot=1
rank 3=localhost slot=1
使用--rankfile
选项将rankfile提供给mpiexec
。有关更多信息,请咨询。谢谢。是否有其他方法检查绑定以确认分配?至于我--报表绑定没有提供任何关于流程绑定的输出您是否有可能将标准错误流重定向到/dev/null
?我认为它没有被重定向到那里。我正在为我的作业使用LSF提交系统,我在将输出重定向到的日志文件中得到其他错误和输出。
rank 0=localhost slot=0
rank 1=localhost slot=0
rank 2=localhost slot=1
rank 3=localhost slot=1