Parallel processing 使用openmp的巨大速度降低_Parallel Processing_Openmp - Fatal编程技术网

Parallel processing 使用openmp的巨大速度降低

parallel-processing

Parallel processing 使用openmp的巨大速度降低,parallel-processing,openmp,Parallel Processing,Openmp,我正在测试一小段代码的速度，如下所示： for(i=0;i<imgDim;i++) { X[0][i] = Z[i] - U1[i] * rhoinv; X[1][i] = Z[i] - U2[i] * rhoinv; X[2][i] = Z[i] - U3[i] * rhoinv; } （i=0；i时间表（动态）引入了巨大的运行时开销。它只应用于每次迭代可能需要不同时间的循环，改进的

我正在测试一小段代码的速度，如下所示：

for(i=0;i<imgDim;i++)
        {
            X[0][i] = Z[i] - U1[i] * rhoinv;
            X[1][i] = Z[i] - U2[i] * rhoinv;
            X[2][i] = Z[i] - U3[i] * rhoinv;
        }

（i=0；i

时间表（动态）

引入了巨大的运行时开销。它只应用于每次迭代可能需要不同时间的循环，改进的负载平衡将证明开销是合理的。对于像您这样的常规循环，动态调度是一种过激行为，因为它引入了不必要的开销，从而降低了计算速度

将计划类型更改为“静态”：

#pragma omp parallel for schedule(static) 
for(i=0;i<imgDim;i++)
{
    X[0][i] = Z[i] - U1[i] * rhoinv;
    X[1][i] = Z[i] - U2[i] * rhoinv;
    X[2][i] = Z[i] - U3[i] * rhoinv;
}

#计划的pragma omp并行（静态）
对于（i=0；iYou可能是内存受限的——如果您的内存总线已经饱和，有更多线程堆积在请求上（以及有自己的开销，包括上下文切换的内存访问）我猜问题是，每个线程的工作量只有几倍和几次加法，完全被创建/运行/销毁并行线程的代码淹没了
#pragma omp parallel for schedule(static) 
for(i=0;i<imgDim;i++)
{
    X[0][i] = Z[i] - U1[i] * rhoinv;
    X[1][i] = Z[i] - U2[i] * rhoinv;
    X[2][i] = Z[i] - U3[i] * rhoinv;
}




[jasmine]相关文章推荐



                                                        
Jasmine ptor.findElements始终返回true
jasmineprotractor 
如何在节点和Jasmine文件之间连接函数声明？
jasmine 
如何在Jasmine和Angular中测试ngOnInit的代码逻辑
jasmineangular6 
Jasmine 如何仅在登录失败时停止量角器执行，但在登录通过时正常运行所有测试
jasmineprotractor 
木偶演员Jasmine Travis CI和多个等级库文件只运行第一个等级库
jasmine 
Jasmine 在量角器中使用黄瓜和X射线
jasmineprotractorcucumber 
Jasmine 当我在Chrome上以无头模式运行时，量角器测试失败
jasmineprotractor 
                                       





随机文章推荐



                                                        
Computer vision 如何从两个立体摄像机构建房间的三维模型？准确构造的决定因素是什么？
computer-vision 
Computer vision 边缘检测，Matlab视觉系统工具箱
computer-vision 
Computer vision 非连续时导出边
computer-vision 
Computer vision Bluestack为应用程序提供图像输出
computer-vision 
Computer vision 如何将两个kinect v.2传感器连接到一台计算机
computer-vision 
Computer vision RANSAC设置：关于参数、原语和迭代的几个问题
computer-vision 
Computer vision 流场特性
computer-vision 
Computer vision 卡尔曼滤波器在视频多目标跟踪中的应用
computer-vision 
Computer vision 如何计算AlexNet的参数数？
computer-vision 
Computer vision caffe:检查失败：target_blobs.size（）=source_layer.blobs_size（）（2对1）层conv1的blob数不兼容
computer-visiondeep-learning 
Computer vision 语义切分&x2014；分类交叉熵与二值交叉熵在二值图像分割中的应用
computer-vision 
Computer vision 大图像上的样式转换。（成片？）
computer-vision 
Computer vision 基于GAN的图像到分割映射与SOTA语义分割方法有何不同？
computer-vision


                                        

                                        
                                        


                                                
                                                        [parallel processing]相关推荐
                                                        
Parallel processing 处理流到同一数据集的查询时高效的MapReduce
									Parallel Processing
							 									Mapreduce
							 
Parallel processing 为并行编程编写伪代码
									Parallel Processing
							 
Parallel processing 序列码中的密集计算部分
									Parallel Processing
							 
Parallel processing CPU与GPU上的MPI-2
									Parallel Processing
							 
Parallel processing Adapteva/A芯片
									Parallel Processing
							 
Parallel processing 使用MPI和OMP进行奇怪的减速
									Parallel Processing
							 									Mpi
							 
Parallel processing 在OpenCL中，是否可以对不同的内核使用相同的内存缓冲区？
									Parallel Processing
							 									Opencl
							 
Parallel processing Xeon Phi从主机openMP并行区域异步卸载
									Parallel Processing
							 
Parallel processing 如何在OpenMP中使用锁定
									Parallel Processing
							 									Fortran
							 
Parallel processing .s.GNU并行，一次执行几个文件中的命令
									Parallel Processing
							 
Parallel processing 如何使用OPEN MP和/或MPI按顺序处理多个文件？
									Parallel Processing
							 
Parallel processing Julia阵列的并行维数统计
									Parallel Processing
							 									Julia
							 
Parallel processing 在Intel Xeon Phi上使用OpenCL进行并行仿真
									Parallel Processing
							 									Opencl
							 
Parallel processing 用Cuda并行实现阵列中连续子序列和的计算
让我们考虑以下数组：
表=[80,12,14,5,70,9,26,30,8,12,16,15]
我想使用cuda计算大小为4的所有可能序列的总和：
例如：
S1=80+12+14+5=111
S2=12+14+5+70 =101
S3=14+5+70+9 =98
....
									Parallel Processing
							 									Cuda
							 
Parallel processing 并行（OpenMP）Fortran代码在长时间后暂停，不会给出错误
									Parallel Processing
							 									Linux Kernel
							 									Fortran
							 
Parallel processing 在GNU parallel中向并行运行的进程添加更多内核
									Parallel Processing
							 
Parallel processing MATLAB如何划分“的迭代次数”；parfor"；关于一台计算机的工人？
									Parallel Processing
							 
Parallel processing 以环的形式发送和接收MPI消息的最佳情况
									Parallel Processing
							 									Mpi
							 
Parallel processing 如何将参数（cucumber标记）从maven/java运行时传递到cucumber jvm并行插件，最好使用maven概要文件
									Parallel Processing
							 
Parallel processing 设置计算单元数（CPU）
									Parallel Processing
							 									Opencl
							 
Parallel processing Kubernetes根据任务计算的吊舱数量
									Parallel Processing
							 									Kubernetes
							 
Parallel processing HyperOptSearch和ray.tune
									Parallel Processing
							 
Parallel processing 使用MPI_散射对阵列进行散射
									Parallel Processing
							 									Mpi
							 
Parallel processing 如何获得“的大小”_cl“设备id”；openCL中的结构？
									Parallel Processing
							 									Opencl
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Entity Framework Core
Localization
Ms Word
Orientdb
Eclipse Rcp
Ios6
Lisp
Deep Learning
Pagination
Xcode
Report
Validation
Umbraco
Google Chrome
Flash
Ethereum
Gdb
Openssl
Log4net
Xmpp
Stm32
Db2
Animation
Sparql
Fortran
Character Encoding
Functional Programming
Fonts
Instagram
Sharepoint
Kubernetes
Memory Management
Ssis
Sails.js
Sugarcrm
Mvvm
Bluetooth
Select
Map
Netbeans
Seo
Swift
Network Programming
Windows 7
Pascal
Opengl Es
Struts2
Keyboard
Firebase
Programming Languages
Bots
Linkedin
Less
Delphi
Webrtc
Marklogic
Uml
Asterisk
Enums
Command Line
Vb.net
Cocos2d X
Cron
Msbuild
Requirejs
Mule
Jetty
Playframework 2.0
Macos
Opencart
Internet Explorer 8
Lambda
Kdb
Nestjs
Wicket
Go
Joomla
Big O
Here Api
Prestashop
Inno Setup
Aurelia
Jakarta Ee
Iis
Drools
Apache Zookeeper
Drupal
Prometheus
Opengl
Migration
Oracle Apex
Apache2
Influxdb
C++11
Testing
Sbt
Extjs4
Fullcalendar
Google Chrome Devtools
C# 3.0
Embedded
Vagrant
Amazon Web Services
Asp.net Mvc 3
Image Processing
Push Notification
Numpy
Loops
Hybris
Scikit Learn
Sip
Transactions
Dart
Twitter
Image
Sencha Touch
Charts
Stata
Directory
Excel Formula
Cluster Computing
Prolog
Shell
Sql Server 2008
Julia
Database
Url
View
Fluent Nhibernate
Xml
Internet Explorer
Grafana
Random
Ionic2
Dom
Html5 Canvas
Jar
Phpmyadmin
Intellij Idea
Angular Material
Windows
Bash
Git
Gcc
Netty
User Interface
Redux
Vmware
Dotnetnuke
Itext
Vim
Qml
Postgresql
Amp Html
Oracle11g
Hibernate
Model View Controller
Csv
Shopify
Docker
Tsql
Wix
Matplotlib
Listview
Debian
Next.js
Apache Flex
Wcf
Path
Actionscript 3
Visual Studio 2012
Language Agnostic
Web Crawler
Perforce
Ftp
Ssas
Drupal 7
Visual Studio 2013
Xaml
Dns
Apache
Certificate
Gis
Python 3.x
D
Jpa
Asp Classic
Maps
Struct
Amazon Cloudformation
Cookies
Routes
Notifications
Templates
Installation
Glassfish
Html
Google Analytics
Api
Yii
Gridview


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网