Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/performance/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Performance 并行或顺序进行几次矩阵乘法更快吗?_Performance_Parallel Processing_Compiler Optimization_Intel Mkl - Fatal编程技术网

Performance 并行或顺序进行几次矩阵乘法更快吗?

Performance 并行或顺序进行几次矩阵乘法更快吗?,performance,parallel-processing,compiler-optimization,intel-mkl,Performance,Parallel Processing,Compiler Optimization,Intel Mkl,我需要乘以N个矩阵对。若我们按顺序乘以矩阵,若矩阵对足够大,Completer可以使用所有的核进行乘法。简单地说,我们做元素乘法 但并行化仍然不是最优的 另一方面,我们可以使用单线程乘法并行乘法K矩阵对,其中K是核心数。我认为这样会有更多的cach未命中率,而且这种方式会更慢。我说得对吗?并行化通常比串行化快,除非您在拆分计算时有大量开销。所以你要问的问题是“我们能有效地分割这个乘法吗?” 是的,我们可以,我们可以将结果的速度提高到Θ(n^2)的量级,特别是关于缓存行为的部分。祝你好运 并行化通

我需要乘以N个矩阵对。若我们按顺序乘以矩阵,若矩阵对足够大,Completer可以使用所有的核进行乘法。简单地说,我们做元素乘法 但并行化仍然不是最优的


另一方面,我们可以使用单线程乘法并行乘法K矩阵对,其中K是核心数。我认为这样会有更多的cach未命中率,而且这种方式会更慢。我说得对吗?

并行化通常比串行化快,除非您在拆分计算时有大量开销。所以你要问的问题是“我们能有效地分割这个乘法吗?”


是的,我们可以,我们可以将结果的速度提高到Θ(n^2)的量级,特别是关于缓存行为的部分。祝你好运

并行化通常比串行化快,除非在拆分计算时有大量开销。所以你要问的问题是“我们能有效地分割这个乘法吗?”


是的,我们可以,我们可以将结果的速度提高到Θ(n^2)的量级,特别是关于缓存行为的部分。祝你好运

在这种情况下,“序列化”是什么?一次执行一步计算,而不是同时拆分和处理:在这种情况下,“序列化”是什么?一次执行一步计算,而不是同时拆分和处理: