为什么CUDA命令行分析器不';我不认识一些柜台?

为什么CUDA命令行分析器不';我不认识一些柜台?,cuda,profiler,Cuda,Profiler,我正在Linux环境中远程处理一些CUDA程序。由于X-forwarding存在问题,我无法使用CUDA Visual Profiler,而必须使用CUDA命令行探查器 问题是,它无法识别我希望它遵循的一些基本计数器。例如,使用以下命令运行程序 COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log \ CUDA_PROFILE_CONFIG=Config.txt ./my_program Config.txt文件为:

我正在Linux环境中远程处理一些CUDA程序。由于X-forwarding存在问题,我无法使用CUDA Visual Profiler,而必须使用CUDA命令行探查器

问题是,它无法识别我希望它遵循的一些基本计数器。例如,使用以下命令运行程序

COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log  \
CUDA_PROFILE_CONFIG=Config.txt ./my_program
Config.txt文件为:

warp_serialize
shared_replay_overhead
结果显示在以下日志中:

NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8

我的环境规格:

Card: GeForce GTX 580
CUDA Driver Version / Runtime Version:          4.1 / 4.1
CUDA Capability Major/Minor version number:    2.0

知道我可能做错了什么吗?

对于具有计算能力2.x的设备,不支持
warp\u serialize
计数器。见表6。Compute Visual Profiler用户指南中的探查器计数器类型

关于
shared\u replay\u开销