Cuda 了解“nvidia smi拓扑-m”输出

Cuda 了解“nvidia smi拓扑-m”输出,cuda,gpu,mpi,pci-e,multi-gpu,Cuda,Gpu,Mpi,Pci E,Multi Gpu,为了在系统上利用GPU,我希望能够绘制一个框图并理解nvidia smi topo-m输出所表示的连接 以下是一个示例输出: 有人能提供这方面的系统级框图吗?对连接的描述也会很好。我相信这将帮助许多人利用他们的多gpu系统。您有两个CPU插槽。每个CPU都有一个PCIe主机网桥PHB,通向两个PCIe交换机。两个乘以两个PCIe交换机中的每个交换机都连接了两个GPU,总共八个。 您有两个CPU插槽。每个CPU都有一个PCIe主机网桥PHB,通向两个PCIe交换机。两个乘以两个PCIe交换机中的

为了在系统上利用GPU,我希望能够绘制一个框图并理解nvidia smi topo-m输出所表示的连接

以下是一个示例输出:


有人能提供这方面的系统级框图吗?对连接的描述也会很好。我相信这将帮助许多人利用他们的多gpu系统。

您有两个CPU插槽。每个CPU都有一个PCIe主机网桥PHB,通向两个PCIe交换机。两个乘以两个PCIe交换机中的每个交换机都连接了两个GPU,总共八个。
您有两个CPU插槽。每个CPU都有一个PCIe主机网桥PHB,通向两个PCIe交换机。两个乘以两个PCIe交换机中的每个交换机都连接了两个GPU,总共八个。

这个节点是什么?看起来不像DGX1。您尝试过hwloc包中的lstopo命令吗?@GillesGouaillardet好主意,我甚至没有考虑过使用MPI端的工具。请注意,即使hwloc项目由Open MPI项目托管,这也是一个独立于MPI库的包。注意,您可能需要自己构建hwloc,并使用-with进行配置-cuda@GillesGouaillardet如何检查hwloc是否使用CUDA支持编译?所以我不能依赖于包管理器安装的hwloc?这个节点是什么?看起来不像DGX1。您尝试过hwloc包中的lstopo命令吗?@GillesGouaillardet好主意,我甚至没有考虑过使用MPI端的工具。请注意,即使hwloc项目由Open MPI项目托管,这也是一个独立于MPI库的包。注意,您可能需要自己构建hwloc,并使用-with进行配置-cuda@GillesGouaillardet如何检查hwloc是否使用CUDA支持编译?所以我不能依赖软件包管理器安装的hwloc?事实上我很喜欢这篇arxiv论文中的图片:太棒了!我想这会帮助很多人。如果nvidia将其构建到nvidia smi中,那将是令人惊讶的,事实上,我很喜欢这篇arxiv论文中的许多图片:太棒了!我想这会帮助很多人。如果nvidia将其构建到nvidia smi中,那将是令人惊讶的,