Nvidia nvprof警告:可能未在LD_LIBRARY_path中设置CUPTI和CUDA注入库的路径
当我试图通过Nvidia的Nvidia nvprof警告:可能未在LD_LIBRARY_path中设置CUPTI和CUDA注入库的路径,nvidia,openacc,nvprof,Nvidia,Openacc,Nvprof,当我试图通过Nvidia的nvprof档案器运行我用OpenACC开发的程序时,我在主题中得到了这样的信息: nvprof ./SFS 4 如果使用-o[output\u file]运行nvprof,则不会出现警告消息,但不会创建输出文件。这里可能出了什么问题 LD_LIBRARY_PATH在my.bashrc中设置为:/opt/nvidia/hpc_sdk/Linux_x86\u 64/20.7/cuda/11.0/lib64/,因为我在那里找到了这些文件(它们的名称中有“cupti”和“i
nvprof
档案器运行我用OpenACC开发的程序时,我在主题中得到了这样的信息:
nvprof ./SFS 4
如果使用-o[output\u file]
运行nvprof
,则不会出现警告消息,但不会创建输出文件。这里可能出了什么问题
LD_LIBRARY_PATH
在my.bashrc
中设置为:/opt/nvidia/hpc_sdk/Linux_x86\u 64/20.7/cuda/11.0/lib64/
,因为我在那里找到了这些文件(它们的名称中有“cupti”和“inj”,我认为它们是必需的):
我在Ubuntu 18.04上。工作站配备Nvidia GeForce RTX 2070,并安装了CUDA版本11
nvidia smi
命令提供以下信息:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66 Driver Version: 450.66 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 2070 Off | 00000000:02:00.0 On | N/A |
| 30% 40C P2 58W / 185W | 693MiB / 7981MiB | 3% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
我拥有的编译器(nvidia和portland)来自最新的nvidia HPC-SDK,版本20.7-0
我用-acc-Minfo=accel
选项编译程序,不确定如何设置-ta=
,是否需要它
另外,我也不确定运行我的代码时,无论是否使用nvprof
都使用GPU,尽管我确实将ACC\U设备类型设置为nvidia
欢迎您提供任何建议
干杯您使用的是哪种nvprof?是NV HPC 20.7附带的还是您自己安装的
<>这看起来与昨天在英伟达DeTalk用户论坛上发布的一个问题非常相似:
虽然这是针对Nsight系统的,但可能是同一个问题。这似乎是我们随NV HPC 20.7 SDK提供的探查器2020.3版本的问题。正如我所指出的,Nsight Systems 2020.4版本应该对此进行修复,因此解决方法是下载并安装2020.4或使用以前的版本
Nsight系统下载中似乎存在一个暂时性问题,希望在您看到本说明之前予以纠正
谢谢你。与此同时,我意识到了问题所在。我编译和运行的代码版本没有OpenACC指令(使用了错误的分支),这似乎混淆了nvprof(我使用了nvprof,它随NV HPC 20.7一起提供)。一旦nvprof运行,我想尝试NV Visual Profiler。据我所知,它随CUDA开发工具包一起提供。我安装了11.1版,但现在我的代码不再运行了。编译仍然很好,就像以前一样,但是当我运行时,我得到一条消息:线程失败:0调用cuInit返回错误804:Other
代码是否在没有分析器的情况下运行?Per:error 804表示“此错误表示系统已升级为向前兼容运行,但CUDA检测到的可见硬件不支持此配置”。我将其解释为,您的设备无法在CUDA 11.1驱动程序上运行CUDA 11.0构建的应用程序。不过,我不确定,因为这超出了我的专业范围。本文档可能会有所帮助:仅供参考,我刚刚使用CUDA11.1驱动程序(455.18)在系统上测试了运行和分析一些代码,它对我来说运行良好。不过,它有一个特斯拉P100,而且是无头的,所以我没有运行视觉分析器。嗨,Mat。我从第一句话就解决了这个问题。在安装CUDA Dev.Toolkit 11.1之后,我的Nvidia驱动程序不知何故损坏了,版本是450.66;CUDA版本:11.0。无论如何,删除CUDA开发工具包(CUDA 11.1)并重新安装Nvidia驱动程序(CUDA 11.0)解决了我第一条评论中的问题(线程失败:0调用cuInit返回错误804
),事实上,您的兼容性表非常有用,我当前的驱动程序(是Ubuntu可用的最新驱动程序),与CUDA 11.1不兼容。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66 Driver Version: 450.66 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 2070 Off | 00000000:02:00.0 On | N/A |
| 30% 40C P2 58W / 185W | 693MiB / 7981MiB | 3% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+