Parallel processing 非SIMD同步的扭曲线程_Parallel Processing_Gpgpu_Hlsl_Compute Shader_Directcompute - Fatal编程技术网

Parallel processing 非SIMD同步的扭曲线程

parallel-processing

Parallel processing 非SIMD同步的扭曲线程,parallel-processing,gpgpu,hlsl,compute-shader,directcompute,Parallel Processing,Gpgpu,Hlsl,Compute Shader,Directcompute,我正在进行平行归约。如果tid32；s>>=1） { 如果（tid

我正在进行平行归约。如果

tid<32

，则所有线程都将处于相同的扭曲中，因此指令假定为SIMD同步，因此我们可以假定

sdata[tid]+=sdata[tid+32]为sdata[tid]+=sdata[tid+16]之前的所有线程完成等等。但这对我来说是不可能的
for (unsigned int s=groupDim_x/2; s>32; s>>=1) 
{ 
    if (tid < s) sdata[tid] += sdata[tid + s]; 
    GroupMemoryBarrierWithGroupSync(); 
}
if (tid < 32)
{ 
    sdata[tid] += sdata[tid + 32];
    sdata[tid] += sdata[tid + 16];
    sdata[tid] += sdata[tid +  8]; 
    sdata[tid] += sdata[tid +  4];
    sdata[tid] += sdata[tid +  2];
    sdata[tid] += sdata[tid +  1]; 
}

for（unsigned int s=groupDim\u x/2；s>32；s>>=1）
{ 
如果（tid

Cuda上相同问题的解决方案已经发布（），但它使用指针和volatile关键字。Directcompute没有指针，并且不允许全局内存中使用volatile关键字
Directcompute没有指针，并且不允许全局内存中使用volatile关键字
的确如此，但它将类似的功能公开为内在功能。将循环中的+=
替换为interlockedd
，然后查看发生了什么。但是，该函数仅适用于整数。
您使用的是什么硬件？注意，英伟达示例假定使用的GPU的翘曲尺寸至少为32，这对于大多数硬件来说是正确的，但对于所有硬件来说都不保证是正确的。特别是Intels集成GPU的翘曲尺寸往往为4（至少是我目前测试的那些），对不起，我应该提到这一点。英伟达




[protocol buffers]相关文章推荐



                                                        
Protocol buffers 是否可以将protobuf二进制文件序列化/反序列化为类似json的文本可编辑模式？
protocol-buffers 
Protocol buffers 协议缓冲区可选整数，与零不同
protocol-buffers 
Protocol buffers protobuf能编码概率分布吗？
protocol-buffers 
Protocol buffers 任何客户端都可以从服务器生成.proto文件吗？
protocol-buffers 
                                       





随机文章推荐



                                                        
Swiftui 如何使文本字段具有多行，光标从左上角开始？
swiftui 
获取父级大小SwiftUI
swiftui 
Swiftui 在列表行中创建宽度相等的快捷UI视图
swiftui 
Swiftui 如何使用NavigationDestinationLink转到其他视图？
swiftui 
Swiftui 无法在视图之间共享环境
swiftui 
watchOS上的SwiftUI窗体：点击手势间歇性失败
swiftui 
在SwiftUI中，如何响应“上的更改”@已出版的vars“*a“的*外部；“视图”；
swiftui 
检查SwiftUI（macOS）中选项键的状态
swiftui 
Swiftui TextField实现时无法推断通用参数“C0”
swiftui 
Swiftui 将图像从缩略图设置为全屏动画
swiftui 
SwiftUI中沿路径的颜色渐变填充
swiftui 
Swiftui 仅在长按手势时更改视图
swiftui 
SwiftUi-hide"；“后退”；按钮和导航栏（显示时间为几分之一秒）
swiftui 
SwiftUI表单选择器选择的背景色
swiftui 
Swiftui self.myString=string和self.\u myString=State（initialValue:string）之间的差异？
swiftui 
在SwiftUI中的函数声明中声明变量时使用未解析标识符
swiftui 
为什么SwiftUI没有在这个全屏上隐藏我的状态栏？
swiftui 
Swiftui TextField"；简介；轻触键盘快捷界面（iOS 14）
swiftuikeyboard 
Swiftui 视图更新后，微调器动画开始反弹
swiftui 
Swiftui：将选择器中的选定文本与前缘对齐
swiftui


                                        

                                        
                                        


                                                
                                                        [parallel processing]相关推荐
                                                        
Parallel processing Fortran C-编译BLAC时调用约定-下划线不匹配
									Parallel Processing
							 
Parallel processing 使用parfor和labSend/labRecieve
									Parallel Processing
							 									Matlab
							 
Parallel processing OpenCL中FFT输入序列大小的未知问题
									Parallel Processing
							 									Opencl
							 
Parallel processing 如何指定哪些进程在并行程序的哪个节点上运行
									Parallel Processing
							 									Mpi
							 
Parallel processing 究竟什么是Redis实例？
									Parallel Processing
							 									Redis
							 
Parallel processing 并行运行Akka流阶段会显著增加内存压力
									Parallel Processing
							 									Akka
							 
Parallel processing 必须使用net.parallel.max启用并行文件传输
									Parallel Processing
							 									Perforce
							 
Parallel processing 使用并行流高效地处理文件比较
									Parallel Processing
							 									Java 8
							 
Parallel processing Tesseract OCR大量文件
									Parallel Processing
							 
Parallel processing 朱莉娅：如何并行执行函数？
									Parallel Processing
							 									Julia
							 
Parallel processing 写入单个向量时OpenMP中的错误共享
									Parallel Processing
							 
Parallel processing 在Julia中使用@distributed进行引导
									Parallel Processing
							 									Julia
							 
Parallel processing Julia-@按顺序而不是并行生成计算作业
									Parallel Processing
							 									Julia
							 
Parallel processing RuntimeError:模块必须在设备cuda:1（设备_ID[0]）上具有其参数和缓冲区，但在设备cuda:2上找到了其中一个参数和缓冲区
									Parallel Processing
							 									Pytorch
							 
Parallel processing MPI：如何确保子例程仅在默认节点上的一个处理器上执行？
									Parallel Processing
							 									Fortran
							 									Mpi
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Google Chrome
Firefox Addon
Pandas
Selenium Webdriver
Cloud
Windows Phone 8
Dynamic
Npm
Dependencies
Localization
Certificate
Azure
Activemq
Twig
Streaming
Corda
Wxpython
Server
Visual Studio
R
Sencha Touch
Yii
Websphere
Jupyter Notebook
Sqlalchemy
Microservices
Sdk
Svn
Dynamics Crm
Amp Html
Internationalization
Node.js
Sublimetext3
Azure Functions
Mdx
Symfony1
Abap
Asterisk
Drools
Svg
Visual Studio 2012
Clojure
Operating System
Ftp
Python
Gradle
Url Rewriting
Unit Testing
Active Directory
Tags
Programming Languages
Express
Telegram
Graphics
Vaadin
Servlets
Protractor
Dictionary
Oop
Uiview
Android Layout
Keyboard
Ios7
Google Colaboratory
Terminal
Facebook
Charts
Sql Server 2008 R2
Serial Port
Openshift
Datetime
Stream
Android Fragments
Msbuild
Gmail
Triggers
Nsis
Google Maps Api 3
Ember.js
Php
Ibm Midrange
Lisp
Jaxb
Ide
Editor
Macos
Acumatica
Oracle Apex
Actionscript
Shell
Permissions
Laravel 4
Matplotlib
Identityserver4
Graphviz
Encoding
Arangodb
Prometheus
Phpunit
Dependency Injection
Sonarqube
Boost
Generics
Django
Jdbc
Knockout.js
Ruby On Rails 3.1
Spring Batch
Gdb
Clearcase
Class
Drupal
Xamarin
Unity3d
Orientdb
Spring Cloud
Xpath
Nestjs
Office365
Cookies
Model
Memory
Google App Maker
Activerecord
Linkedin
Iframe
Computer Vision
Latex
Post
Notifications
Apache Flex
Fortran
Asp.net Core
Sublimetext2
Hadoop
Silverstripe
Postman
Libgdx
Exchange Server
Kernel
Atom Editor
Tcl
Pdf
Xmpp
Dataframe
Caching
Windows
Stanford Nlp
Apache Flink
Visual Studio 2017
EmptyTag
Web Applications
Concurrency
Configuration
Sharepoint
Ios5
Visual Studio 2008
Sml
Lua
Jboss
Excel Formula
Appium
Qml
Optimization
Virtualbox
Asynchronous
Geometry
Llvm
Netty
Eclipse Rcp
Jsf
.net 4.0
Ssl
Jersey
Openlayers
Mule
Rust
Rally
Drupal 7
Object
Windbg
Sugarcrm
Composer Php
Hybris
Html5 Canvas
Menu
Css
Io
Amazon S3
Rest
Proxy
Wordpress
Frameworks
Vba
Jestjs
Blockchain
Install4j
Printing
Openid
Shiny
Notepad++


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网