Nvidia nvprof警告:可能未在LD_LIBRARY_path中设置CUPTI和CUDA注入库的路径

Nvidia nvprof警告:可能未在LD_LIBRARY_path中设置CUPTI和CUDA注入库的路径,nvidia,openacc,nvprof,Nvidia,Openacc,Nvprof,当我试图通过Nvidia的nvprof档案器运行我用OpenACC开发的程序时,我在主题中得到了这样的信息: nvprof ./SFS 4 如果使用-o[output\u file]运行nvprof,则不会出现警告消息,但不会创建输出文件。这里可能出了什么问题 LD_LIBRARY_PATH在my.bashrc中设置为:/opt/nvidia/hpc_sdk/Linux_x86\u 64/20.7/cuda/11.0/lib64/,因为我在那里找到了这些文件(它们的名称中有“cupti”和“i

当我试图通过Nvidia的
nvprof
档案器运行我用OpenACC开发的程序时,我在主题中得到了这样的信息:

nvprof ./SFS 4
如果使用
-o[output\u file]
运行
nvprof
,则不会出现警告消息,但不会创建输出文件。这里可能出了什么问题

LD_LIBRARY_PATH
在my
.bashrc
中设置为:
/opt/nvidia/hpc_sdk/Linux_x86\u 64/20.7/cuda/11.0/lib64/
,因为我在那里找到了这些文件(它们的名称中有“cupti”和“inj”,我认为它们是必需的):

我在Ubuntu 18.04上。工作站配备Nvidia GeForce RTX 2070,并安装了CUDA版本11

nvidia smi
命令提供以下信息:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66       Driver Version: 450.66       CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 2070    Off  | 00000000:02:00.0  On |                  N/A |
| 30%   40C    P2    58W / 185W |    693MiB /  7981MiB |      3%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
我拥有的编译器(nvidia和portland)来自最新的nvidia HPC-SDK,版本20.7-0

我用
-acc-Minfo=accel
选项编译程序,不确定如何设置
-ta=
,是否需要它

另外,我也不确定运行我的代码时,无论是否使用
nvprof
都使用GPU,尽管我确实将
ACC\U设备类型设置为
nvidia

欢迎您提供任何建议


干杯

您使用的是哪种nvprof?是NV HPC 20.7附带的还是您自己安装的

<>这看起来与昨天在英伟达DeTalk用户论坛上发布的一个问题非常相似:

虽然这是针对Nsight系统的,但可能是同一个问题。这似乎是我们随NV HPC 20.7 SDK提供的探查器2020.3版本的问题。正如我所指出的,Nsight Systems 2020.4版本应该对此进行修复,因此解决方法是下载并安装2020.4或使用以前的版本

Nsight系统下载中似乎存在一个暂时性问题,希望在您看到本说明之前予以纠正

谢谢你。与此同时,我意识到了问题所在。我编译和运行的代码版本没有OpenACC指令(使用了错误的分支),这似乎混淆了nvprof(我使用了nvprof,它随NV HPC 20.7一起提供)。一旦nvprof运行,我想尝试NV Visual Profiler。据我所知,它随CUDA开发工具包一起提供。我安装了11.1版,但现在我的代码不再运行了。编译仍然很好,就像以前一样,但是当我运行时,我得到一条消息:
线程失败:0调用cuInit返回错误804:Other
代码是否在没有分析器的情况下运行?Per:error 804表示“此错误表示系统已升级为向前兼容运行,但CUDA检测到的可见硬件不支持此配置”。我将其解释为,您的设备无法在CUDA 11.1驱动程序上运行CUDA 11.0构建的应用程序。不过,我不确定,因为这超出了我的专业范围。本文档可能会有所帮助:仅供参考,我刚刚使用CUDA11.1驱动程序(455.18)在系统上测试了运行和分析一些代码,它对我来说运行良好。不过,它有一个特斯拉P100,而且是无头的,所以我没有运行视觉分析器。嗨,Mat。我从第一句话就解决了这个问题。在安装CUDA Dev.Toolkit 11.1之后,我的Nvidia驱动程序不知何故损坏了,版本是450.66;CUDA版本:11.0。无论如何,删除CUDA开发工具包(CUDA 11.1)并重新安装Nvidia驱动程序(CUDA 11.0)解决了我第一条评论中的问题(
线程失败:0调用cuInit返回错误804
),事实上,您的兼容性表非常有用,我当前的驱动程序(是Ubuntu可用的最新驱动程序),与CUDA 11.1不兼容。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66       Driver Version: 450.66       CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 2070    Off  | 00000000:02:00.0  On |                  N/A |
| 30%   40C    P2    58W / 185W |    693MiB /  7981MiB |      3%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+