Opencl 单个程序中有多个内核，而每个程序只有一个内核_Opencl - Fatal编程技术网

Opencl 单个程序中有多个内核，而每个程序只有一个内核

opencl

Opencl 单个程序中有多个内核，而每个程序只有一个内核,opencl,Opencl,将多个内核放在一个程序中，或者为每个内核编译不同的程序（不包括源代码组织），实际的区别是什么？具体来说，寄存器压力是由程序的大小决定的，还是由程序中选择的实际内核决定的？是否为任何内核的运行分配了所有内核的所有\u本地存储的总和？是否还有其他与性能相关的观察（例如，将代码上载到设备的大小等）？这可能是特定于设备的，我是根据英特尔GPU的经验说的。程序范围资源将仅对该程序中的内核可见。除此之外，寄存器分配是每个内核的；因此，K个程序中的1个内核与1个程序中的K个内核对寄存器压力没有影响。您确实为每

将多个内核放在一个程序中，或者为每个内核编译不同的程序（不包括源代码组织），实际的区别是什么？具体来说，寄存器压力是由程序的大小决定的，还是由程序中选择的实际内核决定的？是否为任何内核的运行分配了所有内核的所有

\u本地存储的总和？是否还有其他与性能相关的观察（例如，将代码上载到设备的大小等）？
这可能是特定于设备的，我是根据英特尔GPU的经验说的。程序范围资源将仅对该程序中的内核可见。除此之外，寄存器分配是每个内核的；因此，K个程序中的1个内核与1个程序中的K个内核对寄存器压力没有影响。您确实为每个程序构建和链接。因此，如果不使用所有的K内核，在一个程序中编译K内核在启动时间方面的效率较低。
谢谢。我对英特尔GPU特别感兴趣。我忘了在问题中提到，\u local
内存呢？如果我在两个不同的内核中声明了两个池，那么任何内核都会分配这两个池的总和，还是遵循相同的寄存器分配规则？不，本地内存只是运行内核的工作组的本地内存。这两种编译策略没有区别。




[neo4j]相关文章推荐



                                                        
Neo4j 如何选择顶点共享公共特性的边？
neo4jgremlin 
更新唯一索引值的Neo4j唯一性
neo4j 
Neo4j 收藏中的位置
neo4j 
Neo4j语言支持
neo4j 
Neo4j 使用Node1的属性值作为Node2的标签名
neo4j 
Neo4j 什么'；s随以“；4J“；及；J"；在数据库/API名称中
neo4jlog4j 
Neo4j 密码匹配与符合某些条件的所有节点都有关系的节点
neo4j 
使我的Neo4j查询更快
neo4j 
Neo4j如何创建水平、垂直和对角关系？
neo4j 
Neo4j 无法正确排序和限制子节点；带有+；选配
neo4j 
Neo4j因果聚类，无法与现有数据库形成聚类
neo4j 
neo4j-在数据库中的所有节点之间创建关系（内存不足）
neo4j 
Neo4j 统计一个人观看的每种类型的电影
neo4j 
Neo4j 查找一组（n）个节点，其中每对节点之间的关系权重大于一个值（w）
neo4j 
Neo4j 约500个插入件后卡住
neo4j 
Neo4j中的完全匹配算法
neo4j 
通过neo4j admin大容量导入后，db.schema（）未正确显示
neo4j 
Neo4J用户配置文件数据建模
neo4j 
Neo4j在使用apoc.merge.relationship（）时向关系添加属性
neo4j 
在Neo4j中重新加载电影推荐数据集
neo4j 
                                       





随机文章推荐



                                                        
Usb 从PC上阅读吉他英雄或摇滚乐队控制器
usb 
删除FAT32 USB上的文件会更改第一个群集信息
usb 
USB设备的多驱动程序
usb 
Android USBHost模式-为什么我的IRDA设备在claimInterface上失败？
usb 
USB性能问题
usb 
在OS X中访问（HID）USB设备
usb 
USB控制传输是否保证交付？
usb 
FASM—USB don上的引导扇区'；行不通
usb 
Usb 有没有办法改变ubuntu 20.04系统中FT230X设备的默认波特率？
usb 
Stm32F407 usb cdc接收中断和定时器中断不同时工作
usbstm32


                                        

                                        
                                        


                                                
                                                        [opencl]相关推荐
                                                        
Opencl 找不到clCreateSubBuffer oO
									Opencl
							 
如何获得一个；“随机”；OpenCL中的数字
									Opencl
							 
Opencl 确定最佳工作组大小和工作组数量的算法是什么
									Opencl
							 
Opencl Nvidia硬件上的ClenqueueEndRange阻塞？（也是多GPU）
									Opencl
							 
常量内存的访问性能是否与OpenCL上的全局内存相同
									Opencl
							 
OpenCL：向多个设备发送相同的cl_mem
									Opencl
							 
更改OpenCL内核中数组的大小
									Opencl
							 
OpenCLSDK概述和硬件互操作性
									Opencl
							 
在OpenCL中使用带双精度的平方根函数（sqrt）
									Opencl
							 
如何防止OpenCL信号量中的死锁？
									Opencl
							 
在哪里可以找到OpenCL（Nvidia）中错误代码的字符串？
									Opencl
							 
如何编译&x27；OpenCL计划'；更快？
									Opencl
							 
使用注释避免NVIDIA上的OpenCL错误
									Opencl
							 
从单独的文件中读取OpenCL内核
									Opencl
							 
如何解决；未找到NVIDIA OpenCL平台-默认为第一个平台；错误
									Opencl
							 
OpenCL工作人员数始终为1
									Opencl
							 
“OpenCL主机可读”；“线程本地”；记忆
									Opencl
							 
OpenCL优化
									Opencl
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Caching
Websocket
Sqlalchemy
Aframe
Websphere
Sockets
Primefaces
Fullcalendar
Jsf
C
Deployment
Visual Studio 2015
Ftp
Google Chrome Devtools
Ssrs 2008
Firebase
Mapreduce
Project Management
Oracle
Requirejs
Visual Studio Code
Dojo
Yii2
Floating Point
Azure Active Directory
Python 3.x
Cloud Foundry
Github
Nosql
Mapping
Jakarta Ee
Iis
Animation
Https
Ip
Breeze
Netlogo
Unit Testing
Firefox Addon
Javafx
Windows Services
Ms Word
Material Ui
Graphql
Wxpython
Frameworks
Antlr
Spring Integration
Aem
Cobol
Xcode
Udp
Scikit Learn
Discord.js
Android
Object
Windows Phone 7
Chef Infra
Timer
Mvvm
Db2
Antlr4
Graphics
Zend Framework2
Racket
Youtube Api
Transactions
Compilation
Data Structures
Salesforce
Web
Spotify
Jboss
Visual C++
Jquery Mobile
Internet Explorer
Firefox
Kibana
Character Encoding
Cluster Computing
Cocoa Touch
Struct
Jquery Ui
Unicode
Winforms
Cypress
Internet Explorer 8
Google Calendar Api
Exception Handling
Ios6
Redirect
Gradle
Julia
Sails.js
Php
Parse Platform
Ffmpeg
Flask
Wordpress
File Upload
Sql Server 2008 R2
Join
Pycharm
Drupal 7
Latex
Cuda
Yocto
Dialogflow Es
Sql
Google Plus
Functional Programming
Active Directory
Sequelize.js
Smalltalk
Silverstripe
Ionic2
Swift3
Smtp
Qml
Debian
Osgi
Grid
Twitter
Instagram
Magento2
Shell
List
Android Studio
Telerik
Ms Office
Data Binding
Url
Module
Hazelcast
Django
Keyboard
Sap
Redis
For Loop
Resharper
Xamarin
Discord
Linux Kernel
Asp.net Mvc 5
Pdf
Text
Gridview
Sonarqube
Socket.io
Google Compute Engine
Grails
Docker Compose
Operating System
Listview
Protractor
Fluent Nhibernate
Time Complexity
Sharepoint 2010
Events
Azure Sql Database
C++11
Applescript
.net
Error Handling
Xna
Database
Glassfish
Unity3d
Sharepoint
Google Cloud Storage
Next.js
Actionscript
Ethereum
Sed
Amazon Dynamodb
Permissions
Sublimetext2
Matrix
Azure Cosmosdb
Exception
Process
Security
Cakephp
Zurb Foundation
Nunit
Dynamics Crm
Ssh
Email
Spring
Ssas
Ember.js
Akka
Nestjs
Pyspark
Grep
Time
Teradata
Xaml
Cocos2d Iphone
Pandas
Recursion


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网