Can';t形mpi环

Can';t形mpi环,mpi,Mpi,我在系统上配置和运行MPI时遇到问题 以下是我尝试过的: 1) 我在一台机器上运行了“mpd&”,然后在同一台机器上运行了“mpdtrace-l”。我将此作为输出:“my-lappy_53430(127.0.1.1)” 2) 在另一台机器上,我运行了“mpd-h-p53430&”,得到了以下错误: akshey-desktop_39993: conn error in connect_lhs: Connection timed out akshey-desktop_39993 (connec

我在系统上配置和运行MPI时遇到问题

以下是我尝试过的:

1) 我在一台机器上运行了“mpd&”,然后在同一台机器上运行了“mpdtrace-l”。我将此作为输出:“my-lappy_53430(127.0.1.1)”
2) 在另一台机器上,我运行了“mpd-h-p53430&”,得到了以下错误:

akshey-desktop_39993: conn error in connect_lhs: Connection timed out akshey-desktop_39993 (connect_lhs 924): failed to connect to lhs at 10.2.28.137 52430 akshey-desktop_39993 (enter_ring 879): lhs connect failed akshey-desktop_39993 (run 267): failed to enter ring akshey-desktop_39993:连接中的连接错误\u lhs:连接超时 akshey-desktop_39993(连接lhs 924):未能在10.2.28.137 52430连接lhs akshey-desktop_39993(输入环879):lhs连接失败 akshey-desktop_39993(运行267):无法进入ring 你能帮我解决这个问题吗?我试着从第二台机器ping和ssh第一台机器(mpd正在运行),结果成功了

在此之后,我在第一台机器上执行了“mpdheck”,得到了以下输出:

* * * first ipaddr for this host (via my-lappy) is: 127.0.1.1 ********** Your unqualified hostname resolves to 127.0.0.1, which is the IP address reserved for localhost. This likely means that you have a line similar to this one in your /etc/hosts file: 127.0.0.1 $uqhn This should perhaps be changed to the following: 127.0.0.1 localhost.localdomain localhost ********** ***此主机的第一个IPADR(通过我的lappy)为:127.0.1.1 以下是第一台机器的/etc/hosts的内容:

127.0.0.1 localhost 127.0.1.1 my-lappy # The following lines are desirable for IPv6 capable hosts ::1 localhost ip6-localhost ip6-loopback fe00::0 ip6-localnet ff00::0 ip6-mcastprefix ff02::1 ip6-allnodes ff02::2 ip6-allrouters ff02::3 ip6-allhosts 127.0.0.1本地主机 127.0.1.1我的膝盖 #以下线路适用于支持IPv6的主机 ::1本地主机ip6本地主机ip6环回 fe00::0 ip6 localnet ff00::0 ip6 mcastprefix ff02::1 ip6所有节点 ff02::2 ip6所有路由器 ff02::3 ip6所有主机 然后我运行“mpdcheck-l”并将其作为输出:

* * * first ipaddr for this host (via my-lappy) is: 127.0.1.1 ********** Your unqualified hostname resolves to 127.0.0.1, which is the IP address reserved for localhost. This likely means that you have a line similar to this one in your /etc/hosts file: 127.0.0.1 $uqhn This should perhaps be changed to the following: 127.0.0.1 localhost.localdomain localhost ********** ********** 您的非限定主机名解析为127.0.0.1,即 为本地主机保留的IP地址。这可能意味着 在/etc/hosts文件中有一行类似于此行: 127.0.0.1美元 这可能应更改为以下内容: 127.0.0.1 localhost.localdomain localhost ********** 即使在将/etc/hosts的第一行更改为“127.0.0.1 localhost.localdomain localhost”之后,我仍然从“mpdcheck-l”获得了相同的输出


请注意,我无权访问网络的DNS服务器,并且这些机器在DNS服务器中没有DNS条目。(我认为这应该不是问题,因为我们总是可以使用IP地址而不是主机名。不是吗?

根据我个人和最近的经验,我想说

127.0.1.1   my-lappy
必须更改为您的LAN地址,并与您的主机名相匹配。您可以使用
hostname
对其进行更改和/或永久编辑
/etc/hostname

然后在
host1
上,您需要启动
mpd--echo
并注意
mpd
将侦听的端口:

mpd_port=N
然后在主机2上启动:

mpd --host=host1 --port=N
所有机器的
/etc/hosts
文件正确解析IP的名称非常重要


mpdtrace-l
将确认戒指设置正确。

根据我个人和最近的经验,我会这样说

127.0.1.1   my-lappy
必须更改为您的LAN地址,并与您的主机名相匹配。您可以使用
hostname
对其进行更改和/或永久编辑
/etc/hostname

然后在
host1
上,您需要启动
mpd--echo
并注意
mpd
将侦听的端口:

mpd_port=N
然后在主机2上启动:

mpd --host=host1 --port=N
所有机器的
/etc/hosts
文件正确解析IP的名称非常重要

mpdtrace-l
将确认环已正确设置。

两点:

  • 你可能不想手工连接MPD戒指。除非您只是使用原始
    mpd
    命令进行一些故障排除,否则您可能需要使用
    mpdboot
    。其用法如中所述
  • 因为您使用的是MPD,所以您使用的是MPICH2或MPICH2派生。从MPICH2 1.1开始,有一个新的流程管理器可用,名为“”。我鼓励您更新到MPICH2的最新版本,并尝试一下hydra。它比MPD更加健壮,并且具有更多的特性,包括更好的性能
  • 两点:

  • 你可能不想手工连接MPD戒指。除非您只是使用原始
    mpd
    命令进行一些故障排除,否则您可能需要使用
    mpdboot
    。其用法如中所述
  • 因为您使用的是MPD,所以您使用的是MPICH2或MPICH2派生。从MPICH2 1.1开始,有一个新的流程管理器可用,名为“”。我鼓励您更新到MPICH2的最新版本,并尝试一下hydra。它比MPD更加健壮,并且具有更多的特性,包括更好的性能

  • 检查系统上是否存在防火墙,这些防火墙可能会阻止默认端口。通过关闭ipchains和iptables来关闭防火墙,以测试这是否是问题所在


    此外,请确保主机名/IP地址正确并且可以成功解析

    检查系统上是否存在防火墙,这些防火墙可能会阻止默认端口。通过关闭ipchains和iptables来关闭防火墙,以测试这是否是问题所在

    此外,请确保主机名/IP地址正确并且可以成功解析