Mpi 如何查看Rocks集群上节点的详细工作?

Mpi 如何查看Rocks集群上节点的详细工作?,mpi,cluster-computing,nodes,mpich,rocks,Mpi,Cluster Computing,Nodes,Mpich,Rocks,我为我的学校项目建立了一个Rocks集群,它是矩阵乘法,一个前端和5台其他计算机是节点。通过MPI,我将矩阵的部分发送给他们,他们使用这些部分进行乘法,然后将数据发送回。我运行的命令是: mpirun -hostfile myhostfile ./myprogram 其中myhostfile是节点名称及其插槽(线程)编号的文件。 我的程序正在运行,我正在尝试分析它 我的问题是,我如何看到每个节点的工作,核心/处理器在执行任务,所有处理器都在工作吗,是否存在某种过载? 我试图安装Vampir p

我为我的学校项目建立了一个Rocks集群,它是矩阵乘法,一个前端和5台其他计算机是节点。通过MPI,我将矩阵的部分发送给他们,他们使用这些部分进行乘法,然后将数据发送回。我运行的命令是:

mpirun -hostfile myhostfile ./myprogram
其中myhostfile是节点名称及其插槽(线程)编号的文件。 我的程序正在运行,我正在尝试分析它

我的问题是,我如何看到每个节点的工作,核心/处理器在执行任务,所有处理器都在工作吗,是否存在某种过载? 我试图安装Vampir profiler和Intels Vtune放大器,但使用上面的命令将它们附加到程序时遇到一些问题(其他命令不允许我在节点的所有线程上运行程序)。我所完成的(除了Ganglia之外,还要看到我的节点工作良好)就是从前端登录到一个节点,使用命令“top”,我可以通过线程数和每个线程上几乎100%的CPU使用率来查看程序的执行时间。

看看mpstat

如果没有参数,它将显示所有核心的聚合负载

mpstat-p ALL
显示每个核心的负载

这将为您的节点提供实时统计信息:

watch pdsh -w compute-01-[01-10] mpstat

(使用您的计算节点名称)

您能给我们一些有关MPI实现细节的详细信息吗?还有,你也在寻找一些内存占用的详细信息吗?嗨,naveen-m,我在寻找类似的东西,只是为了看看节点自己的详细工作,在内存使用和内核上的cpu使用方面,这是我使用的代码。你有机会尝试其他探查器吗?我建议使用Allinea(滴滴涕)或TAU。Allinea有30个试用版,它的配置和使用应该是直截了当的…Allinea可以提供最佳使用内存占用详细信息。TAU也是一种类似的工具,具有几乎相似的特性。同时,让我看看mpich文档,并尝试找出是否有任何env变量来打印内存详细信息!!