Cuda 分析MPI+;库达

Cuda 分析MPI+;库达,cuda,mpi,profiler,openmpi,Cuda,Mpi,Profiler,Openmpi,我正在开发一个MPI+cuda项目,我试图用nvvp和nvprof来评测我的应用程序,但在这两种情况下都没有给出评测。该应用程序运行完全正常,但未生成任何配置文件 nvprof mpirun -np 2 MPI_test [...] ======== Warning: No CUDA application was profiled, exiting 我尝试了simpleMPI cuda示例,得到了相同的结果 我正在580 GTX和openMPI 1.7.3中使用CUDA 5.0(功能齐全,尚

我正在开发一个MPI+cuda项目,我试图用nvvp和nvprof来评测我的应用程序,但在这两种情况下都没有给出评测。该应用程序运行完全正常,但未生成任何配置文件

nvprof mpirun -np 2 MPI_test
[...]
======== Warning: No CUDA application was profiled, exiting
我尝试了simpleMPI cuda示例,得到了相同的结果

我正在580 GTX和openMPI 1.7.3中使用CUDA 5.0(功能齐全,尚未发布,因为我正在测试CUDA感知选项)


有什么想法吗?非常感谢。

mpirun
本身不是CUDA应用程序。您必须像
mpirun-np2nvprofmpi\u测试那样运行探查器。但您还必须确保
nvprof
的每个实例(在这种情况下有两个实例)都在写入不同的输出文件。Open MPI导出
OMPI\u COMM\u WORLD\u RANK
环境变量,该变量在
MPI\u COMM\u WORLD
中给出进程级别。这可以在另一个包装中使用,例如
wrap\u nvprof

#!/bin/bash
nvprof -o profile.$OMPI_COMM_WORLD_RANK $*

这应该像
mpirun-n2.\wrap\u nvprof executable那样运行,而你的问题或多或少是重复的。

你是否尝试在linux下评测?因为在linux操作系统上,我必须将应用程序的绝对路径传递给nvprof。如果我没有通过,我会得到和你一样的警告。我已经在你说的答案中测试了脚本。但是问题是到可执行文件的路径,nvprof需要。/MPI_test所以
mpirun-n2./wrap_nvprof/path_to_executable
是正确的方法。非常感谢你!这取决于
nvprof
如何执行二进制文件。相对路径,例如
/executable
,也应该可以工作。是的,当然,我的意思是,
nvprof
在可执行之前需要
/
/
,至少在我的情况下是这样。