如何检查Altera OpenCL中的吞吐量和延迟

如何检查Altera OpenCL中的吞吐量和延迟,opencl,intel-fpga,Opencl,Intel Fpga,在altera设计示例中,我尝试了vector add,但无法从编译结果中获得内核的吞吐量和延迟 我读了Altera的编程指南。它提到要使用profile.mon 是否可以使用-march=emulator--profile运行aocl报告 另外,请告诉我是否有其他方法可以获得内核的吞吐量和延迟。您可以从profiler获得哪些信息,请查看《Altera SDK for OpenCL最佳实践指南》。这里有示例屏幕截图和详细信息。 这是一个可以让您直接进入该部分的链接 我可能是错的,但我认为不可能

在altera设计示例中,我尝试了vector add,但无法从编译结果中获得内核的吞吐量和延迟

我读了Altera的编程指南。它提到要使用
profile.mon

是否可以使用
-march=emulator--profile
运行aocl报告


另外,请告诉我是否有其他方法可以获得内核的吞吐量和延迟。

您可以从profiler获得哪些信息,请查看《Altera SDK for OpenCL最佳实践指南》。这里有示例屏幕截图和详细信息。 这是一个可以让您直接进入该部分的链接


我可能是错的,但我认为不可能从emulator获得分析信息。我总是构建完整的内核来实现这一点。

Simon,如果你不介意一个小的历史“冒险”,你可以尝试下载并安装13.1版的Altera(现在的Intel)OpenCL SDK。这些旧工具有一个选项,可以默认打印吞吐量,也可以通过--estimate throughput开关打印吞吐量。这些估算仅适用于Stratix V卡(例如PCIe385n_d5)。阿里亚10号当时并不存在。但是知道架构上的设备有些相似,这应该给你一些指导。之后,不要忘记向Intel提交服务请求,将这些估计值放回OpenCLSDK编译器


如果您更喜欢冒险,您可以在Modelsim Intel Starter Edition(免费)中模拟内核,即使没有DDRx和PCIe型号,这将为您提供吞吐量和延迟问题的周期精确答案。您可以使用QSYS自动生成整个测试台。

您的cpu是amd还是intel?如果是amd,你可以试试codexl,它显示了内核延迟和阵列拷贝带宽等的可视化表示。不,我的CPU是Intel,我在FPGAThanks上询问有关内核延迟和吞吐量的信息。当我构建完整内核时,我会在bin文件夹中得到一个文件名kernel\u name.attrib,其中包含以下信息矢量化:1最大矢量化:16个拷贝:2最大拷贝:2吞吐量:21.75复制因子:1共享:1最大共享:1展开:1最大展开:1吞吐量\u展开:1攻击性\u展开:1这里有一个吞吐量值,但我不知道是否是指内核。是否有帮助文档可以帮助您了解.attrib文件中的详细信息?请参阅。这似乎不是你可以依赖的东西,因为这可能只是一个估计。您可以尝试在AlteraOpenCL论坛上找到更多内容。