运行示例CUDA应用程序的正确方法？_Cuda - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/three.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
运行示例CUDA应用程序的正确方法？_Cuda - Fatal编程技术网

运行示例CUDA应用程序的正确方法？

cuda

运行示例CUDA应用程序的正确方法？,cuda,Cuda,我正试图在Ubuntu 16.04 ARM上启动示例cuda应用程序vectorAdd。我使用.cu文件进入目录，运行sudo make，然后运行/vectorad。结果是 [Vector addition of 50000 elements] Copy input data from host memory to CUDA device CUDA kernel launch with 196 blocks and 256 threads Copy output data from CUDA d

我正试图在Ubuntu 16.04 ARM上启动示例cuda应用程序

vectorAdd

。我使用

.cu

文件进入目录，运行

sudo make

，然后运行

/vectorad

。结果是

[Vector addition of 50000 elements]
Copy input data from host memory to CUDA device
CUDA kernel launch with 196 blocks and 256 threads
Copy output data from CUDA device to the host memory
Test PASSED
Done

这是运行此应用程序的正确方法吗？如果是的话，为什么我不能输入两个样本向量数据，并看到像常规C或C++程序那样的输出？非常感谢您的帮助。

不要将此示例视为“通过

std:：cin输入向量”程序：向量是在运行时生成的，只要GPU正确求和，它们的值就无关紧要
// Initialize the host input vectors with random values
for (int i = 0; i < numElements; ++i)
{
    h_A[i] = rand()/(float)RAND_MAX;
    h_B[i] = rand()/(float)RAND_MAX;
}

//使用随机值初始化主机输入向量
对于（int i=0；i

结果随后也会在CPU上进行验证
这是运行此应用程序的正确方法吗
是的，它符合我刚才写的。
因为这就是示例代码的编写方式。如果您是一名程序员，您可以很容易地进入并修改代码，使其按照您建议的方式运行。不管怎样，您运行代码的方法是正确的。有没有办法让我检查结果是否得到验证，或者测试通过了行本身是否与验证相符？@sam：您可以阅读代码而不是提问here@sam阅读源代码：如果CPU验证成功，它将打印测试通过
。




[three.js]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
使用保存的检查点多次运行推理模型会产生随机错误-Tensorflow
tensorflow 
Tensorflow Keras获得中间层的输出
tensorflowneural-networkkeras 
Tensorflow 带预训练word2vec的Seq2seq嵌入
tensorflow 
Tensorflow 深度学习：以下数据的内存不足错误'；太宽了
tensorflowdeep-learning 
Tensorflow 在哪里可以获得“预培训”的模型；显示和讲述：一个神经图像标题生成器；？
tensorflow 
Tensorflow 张量的稀疏表示是什么
tensorflow 
如何使用save_model api保存tensorflow seq2seq模型？
tensorflow 
Tensorflow 有没有办法在dnn中的gpu上融合全连接层（gemm）和激活层（relu/sigmoid）？
tensorflow 
Tensorflow的性能分析工具
tensorflow 
在python中像xml etree一样解析pbtxt（tensorflow）
tensorflowprotocol-buffers 
Tensorflow 由于Visual Studio，CUDA 8.0安装失败
tensorflowcuda 
Tensorflow 张量流错误：登录和标签必须是可广播的
tensorflow 
Tensorflow 在SERVICE的Keras模型中包含波束预处理图
tensorflowkeras 
Tensorflow YOLO v3完整体系结构
tensorflow 
Tensorflow 无法压缩维度[1]，应为维度1，获得14[{{node metrics_2/acc/squence}]]
tensorflow 
是否有一个tensorflow keras，它是一堆致密层的包装？
tensorflowkeras 
Tensorflow 自定义Keras投影层
tensorflowkerasdeep-learning 
Tensorflow 有没有办法将keras MobileNet V2模型划分为子模型？
tensorflowkeras 
Tensorflow 如何解释CNN中的model.summary（）输出？
tensorflowkerasdeep-learninggoogle-colaboratory 
Tensorflow 使用TF ImageGenerator训练模型时出现未知尺寸错误
tensorflowimage-processingkerasdeep-learning


                                        

                                        
                                        


                                                
                                                        [cuda]相关推荐
                                                        
Cuda 增加块大小会降低性能
									Cuda
							 
在CUDA中按键排序3个数组（可能使用推力）
									Cuda
							 									Sorting
							 
CUDA中的2D共享内存是如何安排的
									Cuda
							 
Cuda 4.0编译错误中printf（）的用法
									Cuda
							 
CUDA和Sconscript
									Cuda
							 
Cuda 从GPU到远程主机的GPUDirect RDMA传输
脚本：
									Cuda
							 
使用CUDA的标准偏差
									Cuda
							 
如何在没有可执行文件的情况下使用Compute Visual Profiler评测cuda项目？
									Cuda
							 
Cuda 全局内存详细信息
									Cuda
							 
结构与Cuda C
									Cuda
							 
Cuda 内核在启动时失败，原因是内核参数
									Cuda
							 
Cuda multiProcessorCount是否提供流式多处理器的数量？
									Cuda
							 
Cuda 并行前缀和，每个线程有多个元素，不使用推力
									Cuda
							 
如何在CUDA中对带条件的多变量使用atomicCAS
									Cuda
							 
实施Dijkstra'；c语言中使用CUDA的s算法
									Cuda
							 
Cuda 开普勒积木每mp？
									Cuda
							 
Cuda 将推力ptr从设备复制到主机
									Cuda
							 
如何将CUDA图书馆与Cilk++；
									Cuda
							 
使用存储在另一个数组中的数组索引时发生Cuda非法内存访问错误
									Cuda
							 									Fortran
							 
Cuda，确定SM上的最后一个区块
									Cuda
							 
Cuda cuBLAS中的前导尺寸是否允许访问任何子矩阵？
									Cuda
							 
NVCC忽略CUDA代码？
									Cuda
							 									Parallel Processing
							 
如何使用cuda c编程逐行扫描文本文件
									Cuda
							 									Parallel Processing
							 
在Mac上安装CUDA 7.5缺少nvrtc
									Cuda
							 
Cuda 浮动2袖口复合体至fftw_复合体
									Cuda
							 
Cuda CuSparse/CuBlas K40 vs GTX Titan X（麦克斯韦）
									Cuda
							 
Cuda 使用OpenCL在Macbook Pro 2016上运行TensorFlow？
									Cuda
							 									Tensorflow
							 									Opencl
							 
CUDA-如何交换设备数组指针？
									Cuda
							 
Cuda 如何对复数使用推力：：范数
									Cuda
							 
在/usr/local下有两个CUDA文件夹。我应该出口哪一种？
									Cuda
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Google Chrome
Firefox Addon
Pandas
Selenium Webdriver
Cloud
Windows Phone 8
Dynamic
Npm
Dependencies
Localization
Certificate
Azure
Activemq
Twig
Streaming
Corda
Wxpython
Server
Visual Studio
R
Sencha Touch
Yii
Websphere
Jupyter Notebook
Sqlalchemy
Microservices
Sdk
Svn
Dynamics Crm
Amp Html
Internationalization
Node.js
Sublimetext3
Azure Functions
Mdx
Symfony1
Abap
Asterisk
Drools
Svg
Visual Studio 2012
Clojure
Operating System
Ftp
Python
Gradle
Url Rewriting
Unit Testing
Active Directory
Tags
Programming Languages
Express
Telegram
Graphics
Vaadin
Servlets
Protractor
Dictionary
Oop
Uiview
Android Layout
Keyboard
Ios7
Google Colaboratory
Terminal
Facebook
Charts
Sql Server 2008 R2
Serial Port
Openshift
Datetime
Stream
Android Fragments
Msbuild
Gmail
Triggers
Nsis
Google Maps Api 3
Ember.js
Php
Ibm Midrange
Lisp
Jaxb
Ide
Editor
Macos
Acumatica
Oracle Apex
Actionscript
Shell
Permissions
Laravel 4
Matplotlib
Identityserver4
Graphviz
Encoding
Arangodb
Prometheus
Phpunit
Dependency Injection
Sonarqube
Boost
Generics
Django
Jdbc
Knockout.js
Ruby On Rails 3.1
Spring Batch
Gdb
Clearcase
Class
Drupal
Xamarin
Unity3d
Orientdb
Spring Cloud
Xpath
Nestjs
Office365
Cookies
Model
Memory
Google App Maker
Activerecord
Linkedin
Iframe
Computer Vision
Latex
Post
Notifications
Apache Flex
Fortran
Asp.net Core
Sublimetext2
Hadoop
Silverstripe
Postman
Libgdx
Exchange Server
Kernel
Atom Editor
Tcl
Pdf
Xmpp
Dataframe
Caching
Windows
Stanford Nlp
Apache Flink
Visual Studio 2017
EmptyTag
Web Applications
Concurrency
Configuration
Sharepoint
Ios5
Visual Studio 2008
Sml
Lua
Jboss
Excel Formula
Appium
Qml
Optimization
Virtualbox
Asynchronous
Geometry
Llvm
Netty
Eclipse Rcp
Jsf
.net 4.0
Ssl
Jersey
Openlayers
Mule
Rust
Rally
Drupal 7
Object
Windbg
Sugarcrm
Composer Php
Hybris
Html5 Canvas
Menu
Css
Io
Amazon S3
Rest
Proxy
Wordpress
Frameworks
Vba
Jestjs
Blockchain
Install4j
Printing
Openid
Shiny
Notepad++


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网