Python CPU到GPU内存开销延迟的诊断?

Python CPU到GPU内存开销延迟的诊断?,python,tensorflow,gpu,Python,Tensorflow,Gpu,我正在使用tensorflow gpu对大型数据集进行大量傅立叶变换 在Windows10任务管理器上,我看到GPU“cuda”引擎的使用率只有5%。GPU专用内存为4.8/6GB(但我也有关于这方面的信息) 由于“cuda”引擎的使用率较低,我假设还有其他瓶颈。最明显的一个是从CPU到GPU内存的传输延迟 python或Windows中是否有任何诊断程序可以显示访问CPU内存的频率 到目前为止,我只想在我所有的tensorflow对象上使用tf.device,看看它们是否真的固定在GPU上。你

我正在使用
tensorflow gpu
对大型数据集进行大量傅立叶变换

在Windows10任务管理器上,我看到GPU“cuda”引擎的使用率只有5%。GPU专用内存为4.8/6GB(但我也有关于这方面的信息)

由于“cuda”引擎的使用率较低,我假设还有其他瓶颈。最明显的一个是从CPU到GPU内存的传输延迟

python或Windows中是否有任何诊断程序可以显示访问CPU内存的频率


到目前为止,我只想在我所有的tensorflow对象上使用
tf.device
,看看它们是否真的固定在GPU上。

你看了吗?@Lescurel在Windows上能工作吗?从未尝试过,但我想会。