Cuda 未完全扭曲中的活动线程数？_Cuda_Nvidia - Fatal编程技术网

Cuda 未完全扭曲中的活动线程数？

cuda

Cuda 未完全扭曲中的活动线程数？,cuda,nvidia,Cuda,Nvidia,我当时正在测试CUDA占用设备，故意尝试一个块有一个线程。电子表格给了我 Active Threads per Multiprocessor:32 Active Warps per Multiprocessor:1 我理解为什么扭曲的数量为1，但预期每个SM的活动线程数为1。这是否意味着，将生成一个扭曲，其中31个结果不会被取消提交。我对此表示怀疑，但我想证实这一点干杯在今天的GPU中，调度的基本单位是扭曲，而不是线程。因此，无论您是只指定一个线程，还是全部指定32个线程，都会以相同的方式为

我当时正在测试CUDA占用设备，故意尝试一个块有一个线程。电子表格给了我

Active Threads per Multiprocessor:32
Active Warps per Multiprocessor:1

我理解为什么

扭曲的数量为1，但预期每个SM的活动线程数为1。这是否意味着，将生成一个扭曲，其中31个结果不会被取消提交。我对此表示怀疑，但我想证实这一点
干杯
在今天的GPU中，调度的基本单位是扭曲，而不是线程。因此，无论您是只指定一个线程，还是全部指定32个线程，都会以相同的方式为调度目的使用扭曲
在本例中，我想说“活动线程”是指与活动扭曲关联的所有线程。根据您的块配置和/或实际线程代码，其中一些线程可能什么也不做，但这些线程仍与计划的扭曲有关
是的，如果你只想运行一个线程，它需要一个完整的扭曲
这是网格配置在两个位置都有1的原因之一：
my_kernel<<<N, 1>>>();

myu内核（）；

或
myu内核（）；

在使用GPU资源方面效率会很低。
我创建了一个简单的测试程序，其中声明了32个单词长的数组。内核代码是简单的d_a[tid]=2*[d_tid]；我只在线程上启动内核。在显示结果时，我只得到了d_a[0]的正确缩放…对数组其他元素的访问显示了一个错误。这告诉我，一个扭曲确实被安排，但它只有一个线程活动，而不是32因此我的问题和我的困惑
my_kernel<<<1,N>>>();




[ember.js]相关文章推荐



                                                        
在Ember.js中正确设计REST-powered列表
ember.js 
Ember.js 为什么即使我没有'；不能指定它的依赖项吗？
ember.js 
Ember.js 使用相对路径构建视图层次
ember.js 
Ember.js 无头测试余烬应用防护罩和茉莉花
ember.jsjasminephantomjs 
Ember.js 如何将父管线参数与余烬数据一起使用？
ember.js 
Ember.js 在Ember中，使用Router，如何将应用程序视图加载到现有的html元素（如div）中
ember.js 
使用Ember.js和Ember.Router将我的application.handlebar分解成单独的模板
ember.js 
Ember.js:Model.createRecord不工作，未出错
ember.js 
Ember.js Ember JS和Ember Rails中的嵌套路由
ember.js 
Ember.js 余烬数据：告知计算属性是否为只读
ember.js 
Ember.js 烬：在路由中使用控制器数据或如何正确获取数据
ember.js 
Ember.js 提交表单时余烬DS.存储错误
ember.js 
Ember.js 我可以在Jenkins CI服务器上的浏览器中运行Ember CLI测试吗？
ember.js 
Ember.js 将hammerJS与emberJS集成
ember.js 
Ember.js 余烬数据一对多关系
ember.js 
Ember.js 如何使用余烬组件注入动态部分？
ember.js 
Ember.js &引用；“未定义”不是一个函数；在依赖项检查器中
ember.js 
Ember.js IE8从Ember 1.10升级到1.13.2后未启动应用程序
ember.js 
ember.js中的Oauth和数据库
ember.jsoauth-2.0 
Ember.js 带有承诺的Ember模型钩子。全部和几个findAll（）
ember.js 
                                       





随机文章推荐



                                                        
Subsonic 亚音速与MS SQL 2008？
subsonic 
Subsonic 亚音速3：来自'的无效投射；字节'；至'；字节[]和#x27；
subsonic 
Subsonic 亚音速更新2.1至3.0
subsonic 
Subsonic 一个程序如何指定亚音速3的连接名称
subsonic


                                        

                                        
                                        


                                                
                                                        [cuda]相关推荐
                                                        
CUDA全局变量
									Cuda
							 
Cuda NVIDIA Fermi中的二级缓存
									Cuda
							 
Cuda GPU上的一级缓存存储
									Cuda
							 
扫描阵列CUDA
									Cuda
							 
Cudamaloc分段故障高值
									Cuda
							 
CUDA-如何在区块上进行平均？
									Cuda
							 
CUDA中的多个纹理引用-在内核时使用
									Cuda
							 
Cuda 嵌套for循环，带+；=转让
									Cuda
							 
从多个cuda文件访问同一设备内存
									Cuda
							 
CUDA双精度和每个线程的寄存器数
									Cuda
							 
Cuda 通过使用32位而不是64位来减少寄存器的数量
									Cuda
							 
Cuda atomicInc（）不工作
									Cuda
							 
Cuda 推力转换损失数据警告
									Cuda
							 
Cuda 同一库中的动态并行性和CC 2.0代码
									Cuda
							 
计算矩阵A。在cuda中转置*A
									Cuda
							 
Cuda 测量GPU中上下文切换的开销
									Cuda
							 
CUDA中的矩阵向量乘法：基准测试和；演出
									Cuda
							 
Cuda 扫描并生成地图（用于推力：：散射）
									Cuda
							 
CUDA：从二进制文件获取所需的计算能力
									Cuda
							 
在JCuda中加载多个模块不起作用
									Cuda
							 
最小还原cuda不工作
									Cuda
							 
Cuda idx无法正确索引矩阵
									Cuda
							 
Cuda 二元函数和多种类型的推力减小
									Cuda
							 
CUDA并行前缀和错误
									Cuda
							 									Floating Point
							 
Cuda安装：我需要Power9吗？
我有一个CPU，一个GPU（Nvidia GeFig GTX 1080 TI）Ubuntu 16.04桌面计算机，AM在CUDA安装的中间。
									Cuda
							 
是否可以通过编程确定CUDA探查器是否正在运行？
									Cuda
							 
寄存器中AVX排列和洗牌的CUDA翻译
									Cuda
							 
Cuda 如何防止推力：：按_键减少_写入可分页内存？
									Cuda
							 
右边的CUDA sum
									Cuda
							 
cuda memcheck大小为4的无效全局读取
									Cuda
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Knockout.js
Speech Recognition
Google Calendar Api
Xaml
Asp.net Web Api
Mapping
Smalltalk
Aurelia
Primefaces
Windows Installer
Ansible
Passwords
Jsf
Security
Git
Windows Phone 8.1
Reactjs
Amazon Cloudformation
Emacs
Ms Word
Youtube Api
Axapta
Drupal 6
Jwt
Virtualbox
Dll
Doctrine
Clojure
Db2
Sap
Influxdb
Google Chrome Devtools
Sublimetext2
Ckeditor
Apache
For Loop
Asp.net
Keyboard
Facebook Graph Api
Windows Phone
Windows Runtime
Gdb
Csv
Scrapy
Text
Less
Inno Setup
Grid
Anaconda
Responsive Design
Logstash
Java 8
Django Models
Tomcat
Maven 2
Amazon Redshift
Geometry
Active Directory
Triggers
Tridion
Airflow
Server
Acumatica
Microsoft Graph Api
Installation
Qml
Variables
Ravendb
Pyspark
Bison
Streaming
Configuration
Android Ndk
Ubuntu
Uml
Animation
Modelica
Linq
Swift2
Objective C
Webgl
Linkedin
Sencha Touch
Jasmine
Firebase
Rust
Combobox
Orchardcms
Url
Routes
Date
Video Streaming
C#
Office Js
Listview
Pointers
Mapreduce
Asp.net Mvc 3
Nhibernate
Smtp
Abap
Visual Studio
Merge
Xsd
Instagram
Amazon Web Services
Oracle10g
Nuget
Regex
Cocos2d X
Android Layout
Ibm Midrange
Automated Tests
Xampp
Templates
Mdx
Printing
Math
Markdown
Cryptography
Laravel
Ignite
Charts
Vagrant
Cygwin
Powershell
Websocket
Twitter
Wpf
Artifactory
Prolog
Swift
Ssis
Visual Studio 2010
Search
Sitecore
Sas
Time Complexity
Google Bigquery
Pandas
Common Lisp
Wso2
Jaxb
Hyperledger Fabric
Http
C++11
Azure Active Directory
Dictionary
Plsql
Kendo Ui
Leaflet
Webview
Google Maps Api 3
Nservicebus
Session
Mobile
Apache Kafka
Web Services
Login
Debian
Akka
Octave
Windows 8
Eclipse Plugin
Antlr4
Sharepoint 2010
Resharper
Pine Script
Windows 10
Sed
Bootstrap 4
Biztalk
Pagination
Gnuplot
Matlab
Google Apps Script
Sqlite
Blockchain
Nlp
Sass
E Commerce
Oracle Apex
Coffeescript
Android Studio
Notepad++
Couchdb
Centos
Silverstripe
Nestjs
Latex
Android
Python Sphinx
Dom
EmptyTag
Ssl
Arrays
Visual Studio 2012
Fullcalendar
Selenium Webdriver
Entity Framework
Jupyter Notebook


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网