Tensorflow:设备序号之间不支持对等访问

Tensorflow:设备序号之间不支持对等访问,tensorflow,deep-learning,gpu,caffe,nvidia-digits,Tensorflow,Deep Learning,Gpu,Caffe,Nvidia Digits,如果设备序号之间不支持对等访问,是否仍可以在某种类型的多gpu设置下运行培训?(据我所知,gpu“未连接”)例如,在GPU上分别计算每个批次,然后在CPU上合并,据我所知,这就是“批次累积”在Caffe后端以数字形式工作的方式 原始输出: 2017-05-10 15:27:54.360688: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordin

如果设备序号之间不支持对等访问,是否仍可以在某种类型的多gpu设置下运行培训?(据我所知,gpu“未连接”)例如,在GPU上分别计算每个批次,然后在CPU上合并,据我所知,这就是“批次累积”在Caffe后端以数字形式工作的方式

原始输出:

2017-05-10 15:27:54.360688: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 1
2017-05-10 15:27:54.360949: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 2
2017-05-10 15:27:54.361504: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 0 and 3
2017-05-10 15:27:54.361738: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 0
2017-05-10 15:27:54.361892: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 2
2017-05-10 15:27:54.362065: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 1 and 3
2017-05-10 15:27:54.362263: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 0
2017-05-10 15:27:54.362485: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 1
2017-05-10 15:27:54.362693: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 2 and 3
2017-05-10 15:27:54.362885: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 0
2017-05-10 15:27:54.362927: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 1
2017-05-10 15:27:54.362967: I tensorflow/core/common_runtime/gpu/gpu_device.cc:779] Peer access not supported between device ordinals 3 and 2
2017-05-10 15:27:54.364638: I tensorflow/core/common_runtime/gpu/gpu_device.cc:908] DMA: 0 1 2 3 
2017-05-10 15:27:54.364668: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 0:   Y N N N 
2017-05-10 15:27:54.364687: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 1:   N Y N N 
2017-05-10 15:27:54.364702: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 2:   N N Y N 
2017-05-10 15:27:54.364717: I tensorflow/core/common_runtime/gpu/gpu_device.cc:918] 3:   N N N Y 
此消息是良性的(它是一条“信息”消息,不是错误)。Tensorflow中的所有功能都可以正常工作,但速度可能比支持点对点访问的不同硬件慢

<> >消息意味着英伟达驱动程序正在报告在GPU之间不可能进行对等访问。有关更多信息,请参阅

您可以使用该命令

nvidia-smi topo -m
显示总线拓扑。

此消息是良性消息(它是一条“信息”消息,不是错误)。Tensorflow中的所有功能都可以正常工作,但速度可能比支持点对点访问的不同硬件慢

<> >消息意味着英伟达驱动程序正在报告在GPU之间不可能进行对等访问。有关更多信息,请参阅

您可以使用该命令

nvidia-smi topo -m

要显示总线拓扑。

在Windows上,nvidia smi topo-m输入参数的组合无效。请运行“nvidia smi-h”以获取help@empty那英伟达smi-h公司说什么呢?windows上的某些程序使用斜杠而不是破折号作为参数。也许也是这样?@CiprianTomoiaga nvidia smi-h给出了“nvidia系统管理接口——v385.54”以及选项和标志列表,其中没有一个是“topo”。选项列表是:dmon、守护程序、replay、pmon、nvlink、时钟、,encodersessions@empty你是如何解决这个问题的?你有没有找到另一种方法来获取hte-topo?@jimifiki-nope。在Windows上,nvidia smi-topo-m输入参数的组合无效。请运行“nvidia smi-h”以获取help@empty那英伟达smi-h公司说什么呢?windows上的某些程序使用斜杠而不是破折号作为参数。也许也是这样?@CiprianTomoiaga nvidia smi-h给出了“nvidia系统管理接口——v385.54”以及选项和标志列表,其中没有一个是“topo”。选项列表是:dmon、守护程序、replay、pmon、nvlink、时钟、,encodersessions@empty你是如何解决这个问题的?你有没有找到另一种方法来获取topo?@jimifiki nope。