Performance 用于分析低级体系结构低效性的开源探查器?

Performance 用于分析低级体系结构低效性的开源探查器?,performance,caching,profiler,Performance,Caching,Profiler,现代处理器使用各种各样的技巧来弥补其处理元素的高速和外部内存的延迟之间的差距。在性能关键型应用程序中,您构建代码的方式通常会对其效率产生相当大的影响。例如,使用该分析器的研究人员能够修复缓存局部性问题,并将几个SPEC2000基准测试程序的执行速度提高一倍。我正在寻找一个开源工具的建议,该工具利用处理器的性能监控支持来定位和分析体系结构的低效率,例如缓存未命中、分支预测失误、前端暂停、通过地址别名造成的缓存污染、长延迟指令和TLB未命中。我知道英特尔(商用)、AMD(免费,但不是开源)和(依赖模

现代处理器使用各种各样的技巧来弥补其处理元素的高速和外部内存的延迟之间的差距。在性能关键型应用程序中,您构建代码的方式通常会对其效率产生相当大的影响。例如,使用该分析器的研究人员能够修复缓存局部性问题,并将几个SPEC2000基准测试程序的执行速度提高一倍。我正在寻找一个开源工具的建议,该工具利用处理器的性能监控支持来定位和分析体系结构的低效率,例如缓存未命中、分支预测失误、前端暂停、通过地址别名造成的缓存污染、长延迟指令和TLB未命中。我知道英特尔(商用)、AMD(免费,但不是开源)和(依赖模拟)。

对于linux,效果很好。实际上,AMD的CodeAnalysist使用oprofile作为其后端

Oprofile使用处理器的内部性能调整机制来分析体系结构的低效性。

对于linux,效果很好。实际上,AMD的CodeAnalysist使用oprofile作为其后端


Oprofile使用处理器的内部性能调整机制来分析体系结构的低效性。

太棒了!Oprofile的opcontrol——列出事件确实列出了人们想要监视的事件网络。太棒了!Oprofile的opcontrol——列出事件确实列出了要监视的事件网络。