Networking 配置MPI节点进行通信时出现问题

Networking 配置MPI节点进行通信时出现问题,networking,ssh,mpi,Networking,Ssh,Mpi,我已经在一台位于/scratch/sharatds目录(安装在NFS上)的机器上安装了mpich1和UPC 然而,当我尝试最初运行它时,它在一台机器上运行良好(lagrid02) 当我尝试将其他机器(lagrid02-09)也包括在循环中时,它抛出了错误 rm_3521: p4_error: rm_start: net_conn_to_listener failed: 36394 p0_30647: p4_error: Child process exited while making co

我已经在一台位于/scratch/sharatds目录(安装在NFS上)的机器上安装了mpich1和UPC

然而,当我尝试最初运行它时,它在一台机器上运行良好(lagrid02)

当我尝试将其他机器(lagrid02-09)也包括在循环中时,它抛出了错误

rm_3521:  p4_error: rm_start: net_conn_to_listener failed: 36394
p0_30647:  p4_error: Child process exited while making connection to remote process on lagrid03: 0
p0_30647: (38.617188) net_send: could not write to fd=4, errno = 32

如果你有一个想法,可能会出什么问题,你能建议我可以采取什么措施让它工作吗?

这是一个系统管理问题,而不是编程问题

首先-mpich_1_?真正地Mpich1自2005年以来没有更新过;我强烈建议改用mpich2。在mpich1问题上,你不会发现很多人愿意提供帮助或支持

关于跨节点的特定错误消息,MPI在节点间通信时可能遇到问题的原因如下:您是否有无密码ssh设置,以便可以从lagrid02进行ssh到lagrid03?各种机器上有防火墙吗?>