acosf实现中的CUDA浮点数_C_Math_Cuda_Ptx - Fatal编程技术网

acosf实现中的CUDA浮点数

c math cuda

acosf实现中的CUDA浮点数,c,math,cuda,ptx,C,Math,Cuda,Ptx,acosf的CUDA C的数学函数实现（CUDA/math_function.h）包含以下内容： if (__float_as_int(a) < 0) { t1 = CUDART_PI_F - t1; } .reg .u32 %r<4>; .reg .f32 %f<46>; .reg .pred %p<4>; // ... mov.b32 %r1, %f1; mov.s32

acosf

的CUDA C的数学函数实现（

CUDA/math_function.h

）包含以下内容：

if (__float_as_int(a) < 0) {
  t1 = CUDART_PI_F - t1;
}

    .reg .u32 %r<4>;
    .reg .f32 %f<46>;
    .reg .pred %p<4>;
    // ...
    mov.b32         %r1, %f1;
    mov.s32         %r2, 0;
    setp.lt.s32     %p2, %r1, %r2;
    selp.f32        %f44, %f43, %f41, %p2;

很明显，

\u float\u as_int（）

不是

float

到

int

舍入。（这将产生一个

cvt.s32.f32

）相反，它将

float%f1

作为位拷贝（

b32

）分配给

%r1

（注意：

%r1

类型为

u32

（无符号int）！！），然后将

%r1

与

%r2

进行比较，就好像它是

s32

（有符号int，令人困惑！！）（谁的值是

）

对我来说这看起来有点奇怪，但显然是正确的

有人能解释一下发生了什么，特别是在if子句测试是否为负的上下文中，解释一下

\uu float\u as\u int（）

在做什么吗（

\u float\u as\u int
将float
重新解释为int
int
是\u float\u as\u int
将float
重新解释为int
int
是有趣的！所以它是为了实现这样的性能原因。单精度浮点比较不是比GPU上的整数比较慢。但是，在此if语句中较早使用signbitf（）需要位提取和比较。很有趣！因此，出于性能原因，它是这样实现的。单精度浮点比较不比GPU上的整数比较慢。较早使用signbitf（）时然而，在这个if语句中，需要位提取和比较。
int __float_as_int(float in) {
     union fi { int i; float f; } conv;
     conv.f = in;
     return conv.i;
}




[math]相关文章推荐



                                                        
Math 将矩阵对角线转换为参差不齐数组？
mathmatrix 
Math 评级机构间协议（Fleiss和Kappa、Krippendorff和Alpha等）Java API？
mathmachine-learningnlp 
Math 项目9了解
math 
Math 高尔夫代码：全部+；-*/3个整数的组合
math 
Math 数学函数映射整数集
mathmapping 
Math 证明陈述的大O
mathbig-o 
Math pow（0，2.2）在hlsl像素着色器中给出1？
math 
Math 实现宽松功能
mathtime 
Math Maple中泰勒级数的定义
math 
Math 在Haskell中实现Gauss-Jordan消元
mathhaskell 
Math 逐像素插值
math 
Math GLSL | Billboard着色器，保持缩放
mathopenglglsl 
Math 在透视图上移动摄影机
mathopengl 
Math 大O混淆：log2（N）对log3（N）
mathbig-o 
Math ASP/VBScript中的十进制计算
mathvbscriptasp-classic 
Math 如何重新缩放使用'；对齐'；？Resizebox不'；似乎不起作用
math 
Math a*b的除数有公式吗？
math 
Math 浮点数学坏了吗？
mathlanguage-agnosticfloating-point 
Math 仅使用加速计计算角度倾斜
math 
Math 在斯芬克斯中将分数分割成多行
mathpython-sphinx 
                                       





随机文章推荐



                                                        
Jasmine LoadFixture未定义？
jasmine 
grunt contrib jasmine的日志记录
jasminegruntjs 
Jasmine 如何在运行Karma时调试PhantomJS
jasminephantomjs 
Jasmine 有没有办法在量角器配置中定义本地配置文件？
jasmineprotractor 
Jasmine 茉莉花&x2B；sinon fakeserver
jasmine 
Jasmine 测试http请求URL的正确方法'；s在角2中
jasmineangular 
用Jasmine 2、量角器和Gulp显示规格文本
jasminegulpprotractor 
Jasmine 如何在主干木偶单元测试中模拟window.location.href？
jasmine 
如何在jasmine测试中模拟RXJS timer（）？
jasminerxjs 
Jasmine 在测试完成后引发错误时导致测试失败
jasminejestjs


                                        

                                        
                                        


                                                
                                                        [c]相关推荐
                                                        
C int数组的影响'；关于类型等价的s大小
									C
							 
C MPI-矩阵的发送和接收行
									C
							 									Mpi
							 
用pthread_create（）替换fork（）
									C
							 									Multithreading
							 
C 字符串比较中的空白问题
									C
							 									Linux
							 
将字符串转换为C/C+中的不同数据类型+；
我如何巧妙地将字符串转换成C++中的不同变量类型，并将它们用比例因子乘以？< /P>
									C
							 									Xml
							 
什么'；C99的目的是什么？
									C
							 
在C语言中，将值赋给单独函数中的数组
									C
							 									Arrays
							 									Function
							 
位字段在C中是如何工作的？
									C
							 
C 如何在OpenGL中使用函数生成曲线
									C
							 									Opengl
							 									Math
							 
C 在if语句的布尔表达式中使用指针
									C
							 									Pointers
							 
C 分段错误：指向字符串数组的指针
									C
							 									Arrays
							 									String
							 									Pointers
							 
C 我们需要在GLIB中释放列表中的每个元素吗
									C
							 									List
							 									Memory Management
							 
Windows 8.1上的WndProc怪异行为：仅在调用dummy printf时有效
									C
							 									Windows
							 									Winapi
							 
“；二进制和”；操作员在while循环中工作？
									C
							 
C 使用%d 6次会产生奇怪的输出。为什么？
									C
							 
在目标包含源的位置使用strncpy（）
									C
							 									String
							 
C 如何扫描以冒号分隔的文件中的整数值
									C
							 
加法在c中不起作用
									C
							 
在c中的无符号短整型中赋值零
									C
							 
获取C中两个字符串之间的字符串数组
									C
							 									Arrays
							 									String
							 
C 双链接列表。代码有效…应该吗？比其他解决方案少得多的代码
									C
							 									Pointers
							 
C 通过内联函数公开静态变量
									C
							 
从c程序中的txt文件中获取特定数字
									C
							 
如何在C语言中实现无递归二叉搜索树的delete函数？
									C
							 
如何在C命令行中使用逗号分隔的输入参数？
									C
							 									Command Line
							 
如何将CRC32的对账系数计算调整为CRC16？
									C
							 
C 为2D数组使用mmap（）初始化共享内存，是否还需要为后续指针映射内存？我应该改用shm吗？
									C
							 
在C中，一个结构如何能够动态分配成员？
									C
							 									Data Structures
							 									Struct
							 									Dynamic
							 
结构c中的默认值[重复]
									C
							 
C 查找bst中所有非终端节点的和
									C
							 									Recursion
							 									Struct
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Exchange Server
Acumatica
Android Studio
Cocos2d X
Vba
Less
Architecture
Maps
Datatables
Gdb
Apache Storm
Svg
Dojo
Yii
Ionic Framework
Extjs
Nativescript
Puppet
Neural Network
Uitableview
Jhipster
Maven 2
Wso2
Webstorm
Java Me
Ruby On Rails 3
Ada
Elixir
Asp.net Mvc 4
Xamarin.forms
Netty
Opencl
Selenium Webdriver
Oracle
Sublimetext3
Parallel Processing
Xamarin.ios
Awk
Teamcity
Windows Installer
Video Streaming
Ide
Model View Controller
Ftp
Testing
Ssl
Formatting
Google Cloud Platform
Shopify
Ethereum
Design Patterns
Python Sphinx
Automation
Ibm Cloud
Hibernate
Collections
Jvm
Wxpython
Linq To Sql
Postgresql
Jquery Mobile
Android Emulator
Doctrine Orm
React Native
Sbt
Windows Phone
Directory
Couchbase
Csv
Cassandra
Build
Select
Drupal 6
Menu
Jmeter
Twitter Bootstrap
Oop
Udp
Combobox
Zurb Foundation
Fonts
Algorithm
Instagram
Markdown
Phpstorm
Sms
Oracle Apex
Bison
Validation
Cypress
Influxdb
Sass
Documentation
Rest
Opengl Es
Ibm Mq
Meteor
Logging
Reference
Redirect
Robotframework
Microservices
Amazon Web Services
Types
Apache Flink
Playframework
Orchardcms
Vhdl
Jupyter Notebook
Encryption
Amp Html
Leaflet
Biztalk
Entity Framework Core
Windows Runtime
Requirejs
Sugarcrm
Android
Cygwin
Identityserver4
Google Calendar Api
Stripe Payments
Mobile
Ecmascript 6
Wpf
Graphql
Sharepoint 2013
Sql Server
Ssh
Responsive Design
Spring Boot
Qt
Ruby On Rails 3.2
Sencha Touch 2
Vb6
Scala
Cobol
Gnuplot
Autodesk Forge
Apache Nifi
Github
Recursion
Xquery
Moodle
Camera
Resharper
Utf 8
Playframework 2.0
Adobe
Woocommerce
Gulp
Omnet++
Sublimetext2
Binary
Io
Wix
Wolfram Mathematica
Postman
Breeze
Wcf
Selenium
Asterisk
Subsonic
Yaml
Webgl
Network Programming
Python 2.7
Protocol Buffers
Razor
Fiware
Lucene
Sml
Linq
Maven
Mips
Compiler Construction
Haskell
Tkinter
Rabbitmq
Doctrine
Uwp
Ms Access
Electron
Docker
Azure Service Fabric
Jquery Plugins
System Verilog
Asp.net Mvc 2
Speech Recognition
Asp Classic
Asp.net Core Mvc
Windows 7
Json
Post
Scrapy
Pdf
Struct
Email
Testng
EmptyTag
Workflow


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网