Cpu 如何在10Hz下监测Xeon Phi上的磁芯利用率?

Cpu 如何在10Hz下监测Xeon Phi上的磁芯利用率?,cpu,intel,intel-vtune,xeon-phi,papi,Cpu,Intel,Intel Vtune,Xeon Phi,Papi,我一直试图以相对较高的频率测量/监控Xeon Phi(Knights Corner,顺序处理器)上所有这些60核的利用率,比如说,至少每0.1s产生10Hz 我试过最新的PAPI图书馆。但它只支持PAPI_TOT___________________________________。这将不起作用,因为我实际上需要与每0.1秒发出的指令相关的内容,而不是完成。在不同周期发出的多条指令可能在同一周期内完成。指令的发出受内核是否停止的影响 其他可用的命令,如“top”和“perf”以1Hz的频率运行,

我一直试图以相对较高的频率测量/监控Xeon Phi(Knights Corner,顺序处理器)上所有这些60核的利用率,比如说,至少每0.1s产生10Hz

我试过最新的PAPI图书馆。但它只支持PAPI_TOT___________________________________。这将不起作用,因为我实际上需要与每0.1秒发出的指令相关的内容,而不是完成。在不同周期发出的多条指令可能在同一周期内完成。指令的发出受内核是否停止的影响

其他可用的命令,如“top”和“perf”以1Hz的频率运行,这对于我的测量来说太慢了。我需要更高的频率。而且,我还需要将度量与代码的重要阶段同步。因此,“英特尔Vtune配置文件”也不适用于我

我是否有可能监控关于至强Phi的说明发布或任何其他与其使用相关的活动?我知道那些硬件计数器在那里,但读取它们对我来说似乎非常具有挑战性。也许我可以通过测量每个线程的CPU时间来推断这个利用率


谢谢

您是从协处理器还是从主机进行监视?@TaylorKidd否,我正在尝试在Xeon Phi上以本机方式进行监视。我目前使用cpu\u time/real\u time作为近似值。我现在没有时间查看,但您可能会看到/proc(/sys/class on phi)中是否有任何相关内容。此外,还有一个问题。即使没有phi实现,您也可以将其用作蓝图和示例。您可以直接从代码中调用
perf_event_open
,按照
perf stat--per core
的方式编程,然后使用特殊的perf
ioctl
s启用代码某部分的PMU计数(或多次读取统计数据)。使用perf_event_open的示例:每个核心模式是AGGR_核心和第1502行。其他更简单的方法(没有硬件计数器)-从代码调用getrusage。@thierry-2015年,
PAPI
不支持
KNL
。较新的版本增加了对它的支持。您是否能够获得每个核心的
利用率?我的理解是
KNL
Xeon Phi
系统内核只有
性能
powersave
调控器,因为
intel\pstate
。对于每个核心的
利用率,很可能需要
ondemand
调控器,默认情况下不可用。您能否分享您如何获得每个核心
利用率的详细信息?我在。