Cuda 我可以信任NVCC优化掉返回类型中的std:：pair吗？_Cuda_Std Pair_Nvcc_Copy Elision_Rvo - Fatal编程技术网

Cuda 我可以信任NVCC优化掉返回类型中的std:：pair吗？

cuda

Cuda 我可以信任NVCC优化掉返回类型中的std:：pair吗？,cuda,std-pair,nvcc,copy-elision,rvo,Cuda,Std Pair,Nvcc,Copy Elision,Rvo,有时，我们需要编写一个（小型）CUDA设备端函数，返回两个值。在C语言中，您可以让该函数去掉两个参数，例如： __device__ void pair_maker(float x, float &out1, float& out2); 在C++中，编写C++的习惯用法是返回 STD:：配对< /C>（可能是 STD:：tuple < /Calp>或结构，但C++元组是笨拙的，结构不够通用）： \uuuuuuuuuuuuuuuuuuuuuuuuuuuuu设备std：：配对器（fl

有时，我们需要编写一个（小型）CUDA设备端函数，返回两个值。在C语言中，您可以让该函数去掉两个参数，例如：

__device__ void pair_maker(float x, float &out1, float& out2);

在C++中，编写C++的习惯用法是返回<代码> STD:：配对< /C>（可能是<代码> STD:：tuple < /Calp>或结构，但C++元组是笨拙的，结构不够通用）：

\uuuuuuuuuuuuuuuuuuuuuuuuuuuuu设备std：：配对器（float x）；

我的问题：我可以信任NVCC（使用

--expt relaxed constepr

）优化指针的结构，并直接分配给变量，然后从

中分配给变量。第一个和。第二个元素？
我没有完整的答案，但从我有限的经验来看，NVCC似乎可以优化std:：pair
了。插图（另请参阅）：
无额外副本或与施工相关的操作
__device__ std::pair<float, float> pair_maker(float x);

#include <utility>

 __device__ std::pair<float, float> pair_maker(float x) {
    float  sin, cos;
    __sincosf(x, &sin, &cos);
    return {sin, cos};
}

__device__ float foo(float x) {
    auto p = pair_maker(x);
    auto sin = p.first;
    auto cos = p.second;
    return sin + cos;
}

__global__ void bar(float x, float *out) { *out = foo(x); }

__global__ void baz(float x, float *out) {
    float sin, cos;
    __sincosf(x, &sin, &cos);
    *out = sin + cos;
}

ld.param.f32    %f1, [param_0];
ld.param.u64    %rd1, [param_1];
cvta.to.global.u64      %rd2, %rd1;
sin.approx.f32  %f2, %f1;
cos.approx.f32  %f3, %f1;
add.f32         %f4, %f2, %f3;
st.global.f32   [%rd2], %f4;
ret;




[vmware]相关文章推荐



                                                        
VMware Virtual Infrastructure Remote CLI在ESX/i中查找未使用的计算机/磁盘
vmware 
将VM从VMWare ESX下载到VMWare player，保留精简存储格式
vmwarevirtual-machine 
Vmware 虚拟机
vmware 
Vmware 如何在非intel vt机器上使用micro cloud foundry vm映像
vmwarecloud-foundry 
获取VMWare数据存储区资源清册数据（资源清册遍历）
vmware 
Vmware VMs va vsphere ESXI 6的internet访问
vmware 
VMware Workstation 12暂停虚拟机，缺点是什么？
vmware 
Vmware 在Google云平台上部署ESXi虚拟机，无需迁移
vmware 
VMware-Minix 3-pkgin错误
vmware 
VMWare工作站的BIOS配置
vmware 
Vmware 服务条款-或者我可以分发一份；“免费”；我网站上的软件？
vmware 
                                       





随机文章推荐



                                                        
File 在Bash中按创建时间将文件排序为毫秒
filebashdate 
File Magento产品可用性->；在可配置产品上找不到代码
filemagentophp 
File applescript/shell脚本-检查图像是否
filebashshellapplescript 
File 转到：连接文件内容
filego 
File 命令作为变量返回
fileshellunixfor-loop 
File 是否有任何WordPress插件可以让用户上传文件并共享？
filewordpress 
File 在php或js中通过http或ftp自动传输文件？
filehttpnetworkingftp 
File 如何重命名此文件
fileunix 
File 通过网络删除文件
filebatch-file 
File 错误代码5，将图像从应用程序目录保存到手机时出现编码错误'；s图像库
filecordovaionic-framework 
File Drupal-文件保存数据-->；集合类型
filedrupal 
File 将添加的文件复制到新文件夹
filemonitoring 
File Can'；t处理文件时不带"；其他"；组
file 
File linux内核：如何删除内核空间中的文件
filelinux-kernel 
File 从.iso Windows安装程序安装Bootcamp
filewindows-7 
File 从.txt检索SHA-1哈希
filehashioserver 
File 在Mule文件连接器中设置createParentDirectory函数的位置
filemule 
File 是否在检查文件更改的脚本中排除文件夹？
filecron 
File 如何在delphi中检查文件指针是否已分配？
filedelphi 
File 如何将大量文件上传到google存储桶？
filecloud


                                        

                                        
                                        


                                                
                                                        [cuda]相关推荐
                                                        
Cuda 在缩减期间终止非活动线程
									Cuda
							 
windows cuda项目中的资源无效
									Cuda
							 
我可以在cuda compute capability 2.0卡上使用多少网格维度？
									Cuda
							 
cuda内核-寄存器
									Cuda
							 
Cuda `执行循环展开时资源不足`错误
									Cuda
							 
Cuda 使用一个内核跨多个卡编程多GPU应用程序/
									Cuda
							 
Cuda 如何通过程序查找Nvidia GPU的类型（特斯拉、费米或开普勒）
									Cuda
							 
Cuda 如何使用cusparse加速预处理共轭梯度？
									Cuda
							 
具有浮点坐标的CUDA纹理存储器
									Cuda
							 
Cuda内核无法启动
									Cuda
							 
cudaMallocHost（）、cudaCreateEvent（）是否与正在执行的内核异步？
									Cuda
							 
CUDA中的OpenGL原子计数器等价物
									Cuda
							 									Glsl
							 
Cuda 如何在设备代码处定义全局内存数组，并在执行后将值传递给主机？
									Cuda
							 
Cuda GPU计数器能否对应用程序代码透明地读取
									Cuda
							 
Cuda 每个多处理器的最大驻留线程数与每个多处理器的最大驻留块数
									Cuda
							 
CUDA-将缓冲区传输到多个设备
									Cuda
							 
Cuda 子矩阵计算
									Cuda
							 									Parallel Processing
							 
CUDA NPP图像点产品具有CUDAERROUNKNOWN
									Cuda
							 
Cuda “什么可能导致？”；“未定义的行为”；在这个并行GPU代码中？
									Cuda
							 
cuda代码是否跳过逻辑表达式中不必要子句的执行？
普通C++，如果我说下面的话，它是安全的，因为第三个子句将跳过执行。我只是想知道cuda内核代码是否也有这个属性，或者考虑到最大化并行性，它没有这个属性
int x[100] = {...}, i = -1;
if (i < 0 || i >= 100 || x[i] == 0) {
  // do something.
}

intx[100]={…}，i=-1；
如果（i=100 | | x[i]==0）{
//做点什么。

									Cuda
							 
CUDA 6.0 cudaMallocManaged错误
									Cuda
							 
cudaMallocHost始终返回内存不足错误
									Cuda
							 
有可能在安装了ubuntu的虚拟机上开发cuda程序吗
									Cuda
							 									Virtualbox
							 
CUDA推力函子GMEM访问：ctor数据拷贝vs ctor dev ptr参数
									Cuda
							 
Cuda 从设备函数调用推力设备_向量
									Cuda
							 
Cuda 卡夫特·唐'；我看不出我的内核做了什么
									Cuda
							 
Cuda 如何在推力集操作中动态设置设备_向量的大小？
									Cuda
							 
Cuda 在这篇NVIDIA博客文章中，为什么通过共享内存复制速度更快？
									Cuda
							 
CUDA-cudaLaunchCooperativeKernel与网格同步
									Cuda
							 
Cuda NCCL项目的NVProf
									Cuda
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Wxpython
Crystal Reports
Google Bigquery
Google Maps
Ecmascript 6
Openshift
Big O
Terraform
Rest
Moodle
Ajax
3d
Html
Subsonic
Odata
Xpages
Xamarin.forms
Sphinx
Hash
Extjs4
C# 3.0
Sockets
Electron
Ftp
Mqtt
Influxdb
Notepad++
Wso2
Asp.net Mvc 4
Sharepoint
Jetty
Yocto
Oracle Apex
Ibm Mq
Fluent Nhibernate
Clojure
Browser
Cygwin
Visual Studio 2012
Snowflake Cloud Data Platform
Ms Access
Report
Google Compute Engine
Android Emulator
Windows Mobile
Nuget
Azure Active Directory
Youtube Api
Javafx
Mapping
Parameters
Here Api
Logstash
Makefile
Version Control
Text
Twitter Bootstrap 3
Build
Paypal
Devexpress
Apache Nifi
Zend Framework
Verilog
Ansible
Certificate
Redux
Sequelize.js
Language Agnostic
Visual C++
Open Source
Gatsby
Internet Explorer
Reporting Services
Windows Services
Hadoop
Timer
Python 3.x
Liferay
Activerecord
Angular
Generics
Eclipse
Blazor
Groovy
List
Command Line
Air
Fortran
Coldfusion
Tfs
Google App Maker
Sml
Internationalization
Sails.js
Openerp
Gstreamer
Breeze
Windows Runtime
Log4net
Processing
Asp.net Mvc
Utf 8
Unix
Artifactory
Geolocation
Angular6
Highcharts
Wcf
Asp.net Web Api
Pycharm
Windbg
Perforce
Material Ui
Android Fragments
Image
Playframework
Google App Engine
Xaml
Triggers
Windows Phone 8.1
Ssas
Vb.net
Microservices
Shiny
Asp.net Mvc 3
Docker Compose
Keyboard
Kubernetes
Google Api
Zurb Foundation
Arrays
Qt
Windows 8
Symfony1
Resharper
Selenium Webdriver
Cluster Computing
Sql Server 2008 R2
Nativescript
Signalr
Loops
Salesforce
Openid
Ruby On Rails 3.2
Cucumber
Pine Script
Amazon Ec2
C#
Nestjs
Frameworks
Apache Zookeeper
Cocoa
Computer Science
Model
Postgresql
Isabelle
Syntax
Configuration
Programming Languages
E Commerce
Airflow
Npm
Notifications
Extjs
Grid
Discord
Ibm Mobilefirst
Cloud Foundry
Next.js
Install4j
Twitter
Iphone
Coffeescript
Dojo
Compiler Errors
Azure Functions
Aws Lambda
Character Encoding
Matrix
Drupal 7
Haskell
Responsive Design
Opengl Es
Aem
Boost
Redirect
Join
Firebase
Selenium
Rxjs
Regex
Collections
D
Combobox
Exception
Sqlalchemy
Neo4j
Hybris
C# 4.0
Enums
Database Design


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网