Parallel processing Cray XE6并行任务/每个节点的并行任务_Parallel Processing_Job Scheduling_Cray

Parallel processing Cray XE6并行任务/每个节点的并行任务

parallel-processing

Parallel processing Cray XE6并行任务/每个节点的并行任务,parallel-processing,job-scheduling,cray,Parallel Processing,Job Scheduling,Cray,在作业提交脚本（Cray XE6）中，“并行任务数”（-n）和“每个节点的并行任务数”（-n）之间有什么区别？我对此缺乏经验，但一些谷歌给出了：每个Cray XE6刀片包括四个计算节点，用于高性能占地面积小的可扩展性–每个处理器最多128个处理器核每个机柜有刀片或3072个处理器内核每个计算节点有两个AMD Opteron™ 6300系列处理器（16核）耦合拥有自己的内存和双子座通信接口设计用于高效运行多达32个MPI任务。或者，它可以被编程为在计算节点和MPI中运行OpenM

在作业提交脚本（Cray XE6）中，“并行任务数”（-n）和“每个节点的并行任务数”（-n）之间有什么区别？

我对此缺乏经验，但一些谷歌给出了：

每个Cray XE6刀片包括四个计算节点，用于高性能占地面积小的可扩展性–每个处理器最多128个处理器核每个机柜有刀片或3072个处理器内核每个计算节点有两个AMD Opteron™ 6300系列处理器（16核）耦合 拥有自己的内存和双子座通信接口设计用于高效运行多达32个MPI任务。或者，它可以被编程为在计算节点和MPI中运行OpenMP 在节点之间

从上面的信息可以看出，一个完整的机柜的n值可以高达3072，两个Opteron（6300系列）的n值可以高达32。

我在这方面没有经验，但一些谷歌给出了：

从上面的信息来看，一个完整机柜的n最多可以是3072，两个Opteron（6300系列）的n最多可以是32。

man-aprun

将解决您的所有问题

-n

表示需要多少可执行文件实例（对于MPI，这表示需要多少MPI进程）

-N

表示每个节点需要多少实例

-d

是深度，即每个实例有多少线程

man aprun

将为您解决所有问题

-n

表示需要多少可执行文件实例（对于MPI，这表示需要多少MPI进程）

-N

表示每个节点需要多少实例

-d

是深度，即每个实例有多少线程

# Launch the parallel job using aprun.
# Run the executable my_mpi_executable.x using total
# of 2048 parallel tasks, with 32 tasks assigned per node.
aprun -n 2048 -N 32 ./my_mpi_executable.x arg1 arg2