C++ 测量CUDA分配时间_C++_C++11_Boost_Cuda - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/160.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ 测量CUDA分配时间_C++_C++11_Boost_Cuda - Fatal编程技术网

C++ 测量CUDA分配时间

c++ c++11 boost cuda

C++ 测量CUDA分配时间,c++,c++11,boost,cuda,C++,C++11,Boost,Cuda,我需要测量使用new分配正常CPU内存与调用cudamalocmanaged之间的时间差。我们正在使用统一内存，并试图找出切换到cudamalocmanaged的利弊。（内核运行速度似乎慢了很多，可能是因为缺少缓存或其他原因。）不管怎么说，我不确定对这些分配进行计时的最佳方式。boost的process\u real\u cpu\u clock，process\u user\u cpu\u clock，或者process\u system\u cpu\u clock中的一个能给我最好的结果吗？

我需要测量使用

new

分配正常CPU内存与调用

cudamalocmanaged

之间的时间差。我们正在使用统一内存，并试图找出切换到

cudamalocmanaged

的利弊。（内核运行速度似乎慢了很多，可能是因为缺少缓存或其他原因。）

不管怎么说，我不确定对这些分配进行计时的最佳方式。boost的

process\u real\u cpu\u clock

，

process\u user\u cpu\u clock

，或者

process\u system\u cpu\u clock

中的一个能给我最好的结果吗？还是应该在C++11中使用常规的系统时间调用？或者我应该用cudaEvent来计时

我认为我不应该使用cuda事件，因为它们用于对GPU进程进行计时，不会准确地对cpu调用进行计时（如果我在那里出错，请纠正我）。如果我可以在mallocManaged事件上使用cuda事件，那么在对

新

调用进行计时时，最准确的比较是什么？我只是对内存分配和时间不太了解。由于boost和nvidia的劣质文档，我读到的所有内容似乎都让我更加困惑。

我建议：

auto t0 = std::chrono::high_resolution_clock::now();
// what you want to measure
auto t1 = std::chrono::high_resolution_clock::now();
std::cout << std::chrono::duration<double>(t1-t0).count() << "s\n";

也就是说，您的实现能够以多快的速度获得当前时间？如果速度较慢，则连续两次呼叫将显示间隔时间较长。在我的系统（at-O3）上，输出顺序如下：

1.2e-07s

这意味着我可以计时1微秒的时间。为了得到更精细的度量，我必须循环许多操作，然后除以操作数，减去循环开销（如果这很重要的话）

如果您对

std:：chrono:：high_resolution_clock

的实现不满意，您可以构建自己的

chrono

时钟。缺点显然是有点不便于携带。但是，您可以免费获得

std:：chrono

duration

和

time\u point

基础设施（时间算术和单位转换）。

我建议：

auto t0 = std::chrono::high_resolution_clock::now();
// what you want to measure
auto t1 = std::chrono::high_resolution_clock::now();
std::cout << std::chrono::duration<double>(t1-t0).count() << "s\n";

也就是说，您的实现能够以多快的速度获得当前时间？如果速度较慢，则连续两次呼叫将显示间隔时间较长。在我的系统（at-O3）上，输出顺序如下：

1.2e-07s

这意味着我可以计时1微秒的时间。为了得到更精细的度量，我必须循环许多操作，然后除以操作数，减去循环开销（如果这很重要的话）

如果您对

std:：chrono:：high_resolution_clock

的实现不满意，您可以构建自己的

chrono

时钟。缺点显然是有点不便于携带。但是，您可以免费获得

std:：chrono

持续时间和时间点
基础设施（时间算术和单位转换）。
您可以使用CUDA事件来测量在主机中执行的函数的时间
cudaEventeLassedTime
计算两个事件之间的运行时间（以毫秒为单位，分辨率约为0.5微秒）
更多信息请访问：
此外，如果您还对内核执行时间的计时感兴趣，您会发现CUDA事件API会自动阻止代码的执行，并等待任何异步调用结束（如内核调用）
在任何情况下，您都应该使用相同的指标（始终是CUDA事件或boost，或您自己的计时）来确保相同的分辨率和开销
CUDA工具包附带的探查器“nvprof”可能有助于理解和优化CUDA应用程序的性能
阅读更多信息：
您可以使用CUDA事件来测量在主机中执行的函数的时间
cudaEventeLassedTime
计算两个事件之间的运行时间（以毫秒为单位，分辨率约为0.5微秒）
更多信息请访问：
此外，如果您还对内核执行时间的计时感兴趣，您会发现CUDA事件API会自动阻止代码的执行，并等待任何异步调用结束（如内核调用）
在任何情况下，您都应该使用相同的指标（始终是CUDA事件或boost，或您自己的计时）来确保相同的分辨率和开销
CUDA工具包附带的探查器“nvprof”可能有助于理解和优化CUDA应用程序的性能
阅读更多信息：
我不确定cudaEvent计时器是否正常工作，因为它报告说使用new
制作阵列比使用cumalocmanaged
花费的时间长80倍，这似乎是错误的。（请注意，感谢您指出探查器。这看起来对于在分配之后安排所有时间非常有用。）您应该添加一个显示该行为的最小示例。这可能有助于获得更好的答案。如果在默认流中已经有一个（异步）内核正在执行，并且我向默认流的FIFO中添加了一个cudaEventRecord，那么cudaEvent将阻塞，直到内核完成“注册”自己，对吗？换句话说，它不会捕获内核运行时发生的CPU执行时间，对吗？我不确定cudaEvent计时器是否正常工作，因为它报告说使用new
制作阵列比使用cumalocmanaged
花费的时间要长80倍，这似乎是错误的。（请注意，感谢您指出探查器。这看起来对于在分配之后安排所有时间非常有用。）您应该添加一个显示该行为的最小示例。这可能有助于获得更好的答案。如果在默认流中已经有一个（异步）内核正在执行，并且我向默认流的FIFO中添加了一个cudaEventRecord，那么cudaEvent将阻塞，直到内核在“注册”之前完成




[c++11]相关文章推荐



                                                        
C++11 C++；0x函数delete-删除除某些类型以外的所有类型
c++11 
C++11 C++；11-如何为多维数组的右值引用提供有效的构造函数？
c++11matrix 
如何向Code:：Blocks编译器添加C++11支持？
c++11 
C++11 多线程示例输出说明
c++11 
C++11 C++；11戴软呢帽10
c++11operating-system 
C++11 lambda捕获；c++；vs elisp
c++11lambda 
C++11 从C+中的对数正态分布生成一个随机数+；
c++11 
C++11 如何使用'；制作ptr<；T>；（）'；而T是一个具有私有结构的类？
c++11 
C++11 “配置错误”；支持C++；需要11种语言特征。”；
c++11gcccompilation 
C++11 是一个C++；函子范畴论意义上的函子？
 C++函数是支持重载的（）操作符的类。这是范畴论意义上的函子吗？什么是对象和态射？
c++11 
C++11 可变模板递归
c++11templatesrecursion 
C++11 静态布尔数组未按设置初始化
c++11 
C++11 在单独的线程上运行QT MainWindow方法
我正在编写一个C++ Qt5小部件桌面应用程序，我需要在一个单独的线程上运行一个启动操作/停止按钮时，运行一个耗时的操作主窗口：：PrimeRealStudioActudio（BOOL）< /C>。p>
c++11 
C++11 C++；11奇怪的符号[0:size（））
c++11 
C++11 C++；带三元运算符的istream条件直接初始化
c++11 
C++11 管理单个内存块的分配器
c++11boostmemory-management 
C++11 如何从Boost可变_缓冲区_1中获取数据？
c++11 
C++11 '；常数'；限定符不能应用于'；标准：：向量<；长无符号整数>&'；
c++11 
C++11 使用ICU将unicode代码点解码为utf8
c++11unicodeutf-8 
C++11 C++；11：第二个元素的范围循环向量？
c++11for-loop 
                                       





随机文章推荐



                                                        
Jquery ui firefox上出错：$。小部件不是函数
jquery-uifirefox 
Jquery ui 在vb.net中使用jquery UI自动完成文本框
jquery-uiautocomplete 
Jquery ui 何时调用jQuery UI的destroy（）？
jquery-ui 
Jquery ui JQuery UI选项卡切换-对话框将不会打开
jquery-uijquerytabs 
Jquery ui 为什么jQuery UI在（）中显示为；盲目的；移除元素？
jquery-uianimation 
Jquery ui 从数据库读取数据并在jquery对话框中显示内容
jquery-uicakephp 
Jquery ui jqueryui从php生成多个对话框
jquery-ui 
Jquery ui JQuery绑定单击事件保留旧绑定值
jquery-uijquery 
Jquery ui 如何测试jQueryUIDroppable上是否至少删除了一项？
jquery-ui 
Jquery ui 使用jquery选择后如何查找td的表头
jquery-uijquery 
Jquery ui 具有Jquery和Primefaces的问题
jquery-uiprimefaces 
Jquery ui jquery attr（'name'）返回未定义
jquery-ui 
Jquery ui jQuery UI Accordion在关闭后不会重新打开
jquery-uijquery 
Jquery ui jquery ui sortable获取正在排序的项目的上一个和下一个
jquery-ui 
Jquery ui 如何添加Telerik引用以便为Telerik datepicker工作？
jquery-uiasp.net-mvc-4 
Jquery ui 第一次鼠标移动时，在缩放的容器上执行jquery ui拖动操作
jquery-ui 
Jquery ui 淘汰列表项动画
jquery-uianimationknockout.js 
Jquery ui jQuery UI日期选择器'；s minDate选项重置当前值
jquery-uiknockout.js 
Jquery ui 包括Angular2和x2B中的jQuery UI；网页包+；纱线
jquery-uiangularwebpack 
Jquery ui jquery ui-范围滑块-输入提交后在滑块句柄上保存值
jquery-ui


                                        

                                        
                                        


                                                
                                                        [c++]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Bluetooth
Apache Flex
Umbraco
Cmd
Xmpp
Cryptography
Express
Composer Php
Module
Vector
Algorithm
Interface
Ms Access
Web Applications
Compilation
Uml
Windows Phone 7
Seo
Ms Office
Database Design
Perl
Powerbi
Object
Sphinx
Certificate
Jar
Jquery Plugins
Bazel
Firefox
Https
Actionscript 3
Racket
Performance
Blockchain
Pip
Exception Handling
Camera
Cocos2d X
Deep Learning
Haskell
Continuous Integration
Html5 Canvas
Xamarin.ios
Sonarqube
Raspberry Pi
Binding
Sockets
Types
C
Visual Studio 2013
Jetty
Core Data
Architecture
Twitter
Phpstorm
Twig
Pyspark
Pointers
Amazon S3
Solr
Meteor
Botframework
Resharper
Xcode4
Gcc
Virtual Machine
Kotlin
Prolog
Opencart
Jvm
Autohotkey
Ruby On Rails 4
Webview
Compiler Construction
Lambda
Reflection
Server
Glassfish
Dependencies
Mysql
Erlang
Apache Spark
Qt4
Ionic Framework
Protractor
Azure
Go
Shell
Boost
Google Api
Spring Batch
Ruby On Rails 3
Telegram
Indexing
Logstash
Formatting
Adobe
Jquery Ui
Jboss
Import
Google App Maker
Coffeescript
Puppet
Asp.net Core Mvc
Plot
Linker
Angular Material
Nest
Xna
Breeze
Animation
Layout
Sql Server 2005
Logging
Latex
Sharepoint 2007
Visual Studio Code
Clearcase
Coding Style
Vuejs2
Debugging
Filter
Properties
Spring Cloud
Com
Flask
Windows Runtime
Python Sphinx
Dictionary
Gstreamer
Tabs
Dom
Single Sign On
Netty
Vaadin
Emacs
Kendo Ui
Google Chrome Devtools
Fiware
Odata
Soap
Blazor
Nestjs
Nunit
Scripting
Twitter Bootstrap
Cakephp
Azure Ad B2c
Web
Omnet++
Menu
Uwp
Project Management
Virtualbox
Deployment
Stripe Payments
Visual Studio
Appium
Twitter Bootstrap 3
Linux Kernel
Atom Editor
Outlook
Ionic2
Npm
Wpf
Llvm
Redirect
Windows Services
Safari
Templates
Db2
Tags
Doctrine
D
Nosql
Debian
Cloud
Joomla
Vhdl
Google Bigquery
Graphviz
Mips
Xampp
Internet Explorer 8
Dynamic
Sparql
Azure Sql Database
Computer Vision
If Statement
Here Api
Rest
Generics
Openssl
Windows 10
Excel
Wicket
Playframework 2.0
Sed
Exchange Server
Telerik
Anaconda


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网