Architecture GPU架构定制?

Architecture GPU架构定制?,architecture,cuda,gpu,nvidia,Architecture,Cuda,Gpu,Nvidia,我正在做一个关于GPU上一些CUDA加速的项目,并完成了一些软件级优化我的计算,同时我也发现GPU架构中的一些变化可能有助于进一步优化项目 现在我的问题是,有没有一种有效的方法或现有的仿真器可以让我更改GPU体系结构中的某些功能或部件,然后我可以在定制的体系结构上对CUDA PTX代码进行基准测试,以获得性能结果(更好地做到周期精确)?有几种CPU架构模拟器,所以我想知道其中是否有一些可以支持GPU? 或者我可能需要自己编写一个GPU模拟器^ ^?您正在寻找的。模拟器准确地模拟NVIDIA GP

我正在做一个关于GPU上一些CUDA加速的项目,并完成了一些软件级优化我的计算,同时我也发现GPU架构中的一些变化可能有助于进一步优化项目

现在我的问题是,有没有一种有效的方法或现有的仿真器可以让我更改GPU体系结构中的某些功能或部件,然后我可以在定制的体系结构上对CUDA PTX代码进行基准测试,以获得性能结果(更好地做到周期精确)?有几种CPU架构模拟器,所以我想知道其中是否有一些可以支持GPU?
或者我可能需要自己编写一个GPU模拟器^ ^?

您正在寻找的。模拟器准确地模拟NVIDIA GPU并执行OpenCL和CUDA工作负载,而无需修改代码。我想也可以选择对PTX工作负载建模。发件人:

GPGPU Sim 3.x运行由CPU部分组成的程序二进制文件 和GPU部分。然而,微体系结构(计时)模型 GPGPU Sim 3.x报告GPU繁忙的周期,但不报告 为CPU定时或PCI Express定时(即内存传输)建模 CPU和GPU之间的时间)

GPGPU sim具有广泛的可配置性,可以为不同的微体系结构建模。例如,您可以调整SMs的数量、扭曲调度程序、SIMD组、每个SM的线程数、共享内存大小、寄存器文件大小以及手册中介绍的许多其他参数。在模拟结束时,模拟器转储执行持续时间(以GPU时钟周期为单位)和许多其他性能计数器

更多信息:

是一种PTX分析仪。在以前的版本中,您可以模拟工作负载。然而,最新版本侧重于PTX代码的编译器优化

是另一个复杂但功能强大的工具,模拟CPU和GPU的异构系统