Shell 运行MPI程序时RSH连接被拒绝

Shell 运行MPI程序时RSH连接被拒绝,shell,unix,mpi,bsd,rsh,Shell,Unix,Mpi,Bsd,Rsh,我试图在8台机器上运行MPI程序,但我得到了错误 connect to address 127.0.0.1 port 544: Connection refused Trying krb4 rsh... connect to address 127.0.0.1 port 544: Connection refused trying normal rsh (/usr/bin/rsh) lagrid02: Connection refused 当我使用machinefile选项运行它时,我得到错误

我试图在8台机器上运行MPI程序,但我得到了错误

connect to address 127.0.0.1 port 544: Connection refused
Trying krb4 rsh...
connect to address 127.0.0.1 port 544: Connection refused
trying normal rsh (/usr/bin/rsh)
lagrid02: Connection refused
当我使用machinefile选项运行它时,我得到错误
lagrid03:No route to host
,其中lagrid03是连接到主节点的相邻节点


我应该如何纠正此错误?

关于您的第一个错误,rsh是否在(所有)机器上运行?在不同机器上启动作业之前,需要配置rsh或无密码ssh(并要求mpi作业启动器使用ssh)


第二个错误表示无法使用当前网络配置访问机器lagrid03。我猜您有一个带有lagrid03 IP地址的/etc/hosts条目,但您没有在该网络中配置接口。要获得更详细的答案,您需要发布有关网络配置的详细信息。

问题在于身份验证,如果您进入
/etc/pam.d/rsh
文件,并将rlogin和rsh移到顶部,使其看起来像这样,它就可以正常工作

/* For root login to succeed here with pam_securetty, "rsh" must be listed in /etc/securetty.*/

auth required pam_nologin.so

auth required pam_securetty.so

auth required pam_env.so

auth required pam_rhosts_auth.so

account include system-auth

session optional pam_keyinit.so force revoke
session include system-auth