Parallel processing Cray XE6并行任务/每个节点的并行任务

Parallel processing Cray XE6并行任务/每个节点的并行任务,parallel-processing,job-scheduling,cray,Parallel Processing,Job Scheduling,Cray,在作业提交脚本(Cray XE6)中,“并行任务数”(-n)和“每个节点的并行任务数”(-n)之间有什么区别?我对此缺乏经验,但一些谷歌给出了: 每个Cray XE6刀片包括四个计算节点,用于高性能 占地面积小的可扩展性–每个处理器最多128个处理器核 每个机柜有刀片或3072个处理器内核每个计算节点 有两个AMD Opteron™ 6300系列处理器(16核)耦合 拥有自己的内存和双子座通信接口 设计用于高效运行多达32个MPI任务。或者,它可以 被编程为在计算节点和MPI中运行OpenM

在作业提交脚本(Cray XE6)中,“并行任务数”(-n)和“每个节点的并行任务数”(-n)之间有什么区别?

我对此缺乏经验,但一些谷歌给出了:

每个Cray XE6刀片包括四个计算节点,用于高性能 占地面积小的可扩展性–每个处理器最多128个处理器核 每个机柜有刀片或3072个处理器内核每个计算节点 有两个AMD Opteron™ 6300系列处理器(16核)耦合 拥有自己的内存和双子座通信接口 设计用于高效运行多达32个MPI任务。或者,它可以 被编程为在计算节点和MPI中运行OpenMP 在节点之间


从上面的信息可以看出,一个完整的机柜的n值可以高达3072,两个Opteron(6300系列)的n值可以高达32。

我在这方面没有经验,但一些谷歌给出了:

每个Cray XE6刀片包括四个计算节点,用于高性能 占地面积小的可扩展性–每个处理器最多128个处理器核 每个机柜有刀片或3072个处理器内核每个计算节点 有两个AMD Opteron™ 6300系列处理器(16核)耦合 拥有自己的内存和双子座通信接口 设计用于高效运行多达32个MPI任务。或者,它可以 被编程为在计算节点和MPI中运行OpenMP 在节点之间


从上面的信息来看,一个完整机柜的n最多可以是3072,两个Opteron(6300系列)的n最多可以是32。

a
man-aprun
将解决您的所有问题

-n
表示需要多少可执行文件实例(对于MPI,这表示需要多少MPI进程)

-N
表示每个节点需要多少实例


-d
是深度,即每个实例有多少线程

A
man aprun
将为您解决所有问题

-n
表示需要多少可执行文件实例(对于MPI,这表示需要多少MPI进程)

-N
表示每个节点需要多少实例

-d
是深度,即每个实例有多少线程

# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2