在不使用FPGA的情况下使用CPU主机运行OpenCl矩阵乘法

在不使用FPGA的情况下使用CPU主机运行OpenCl矩阵乘法,opencl,fpga,hpc,Opencl,Fpga,Hpc,我能够在我的Stratix V FPGA上成功运行“矩阵乘法设计示例”。要编译OpenCL内核,我使用以下命令(Cento 6.9): aoc设备/matrix_mult.cl-o bin/matrix_mult.aocx-fp released-fpc-no interleaving=默认值--板395_hpc_ab 我的问题是:我试图比较 基于FPGA和dsp的矩阵乘法设计实例 不使用FPGA的矩阵乘法设计实例 那么,我可以在我的主机CPU上编译并运行这个矩阵乘法设计示例而不使用FPGA

我能够在我的Stratix V FPGA上成功运行“矩阵乘法设计示例”。要编译OpenCL内核,我使用以下命令(Cento 6.9):

aoc设备/matrix_mult.cl-o bin/matrix_mult.aocx-fp released-fpc-no interleaving=默认值--板395_hpc_ab

我的问题是:我试图比较

  • 基于FPGA和dsp的矩阵乘法设计实例
  • 不使用FPGA的矩阵乘法设计实例

那么,我可以在我的主机CPU上编译并运行这个矩阵乘法设计示例而不使用FPGA吗?如何?

您可以使用线性代数库中的矩阵乘法函数(例如ATLAS或OpenBlas)对相同大小的矩阵进行时间乘法。您可以从比较compute_reference()函数中的引用实现开始,默认情况下运行该实现。然后可能会与@BenVoigt建议的优化版本进行比较。