Statistics 多核随机任务的统计

Statistics 多核随机任务的统计,statistics,Statistics,考虑到在处理器内核上完成任务的时间是一个平均值m和标准偏差s的分布。如果相同的任务在n内核上运行,则完成任务所需时间的平均值和标准偏差是多少?(当一个核心完成任务时,任务就完成了)这更像是一个统计问题,而不是其他任何问题。如果没有关于单个任务需要完成的时间t分布函数的信息,我只能给你一个提示:你需要计算任务n的t最小值的分布函数,如图所示。使用它,您可以计算平均值和标准偏差 这是家庭作业吗 编辑: 使用多核是否有价值以及价值多少取决于以下几点: 你需要做什么。如果您必须使用不同的输入运行同一个

考虑到在处理器内核上完成任务的时间是一个平均值
m
和标准偏差
s
的分布。如果相同的任务在
n
内核上运行,则完成任务所需时间的平均值和标准偏差是多少?(当一个核心完成任务时,任务就完成了)

这更像是一个统计问题,而不是其他任何问题。如果没有关于单个任务需要完成的时间
t
分布函数的信息,我只能给你一个提示:你需要计算任务
n
t
最小值的分布函数,如图所示。使用它,您可以计算平均值和标准偏差

这是家庭作业吗

编辑:

使用多核是否有价值以及价值多少取决于以下几点:

  • 你需要做什么。如果您必须使用不同的输入运行同一个程序,那么启动多个实例非常有意义。它可能不会将总时间减少到
    1/n
    ,而且每个实验仍然需要至少与以前一样多的时间,但整个系列所需的时间将显著减少

    另一方面,如果您希望使用不同的种子运行相同的任务,并保留收敛速度最快的种子,那么您可能会获得更少的收益,正如我回答的第一部分所估计的那样

  • 您将任务并行化的程度如何
    n
    完全独立的任务是理想的场景<代码>n具有多个同步点等的线程将无法达到同样的效率

  • 硬件处理多个任务的能力。例如,如果这些任务中的每一项都需要大量内存,那么仅使用单个内核可能比通过同时运行多个实例强制系统使用交换空间/pagefile/无论您的操作系统调用什么都要快


不是作业,我想看看在1秒钟内并行运行此类任务会有多大的改进。您是否要并行运行相同的随机任务?例如,在所有核上以相同的输入运行相同的遗传算法,并保持收敛最快的一个?或者在每个内核中使用不同的输入运行一个单独的进程来并行化您的任务?数字函数最小化,每个内核使用不同的种子,您会运行所有这些实验吗?实验会更快吗?嗯,我想找到一个运行这个的最佳内核数量,并找出它是否值得在GPU的内核上运行,而不是在CPU的内核上运行。移植到GPU需要一些时间。