如何将TensorFlow图（模型）拆分到多个GPU上以避免OOM？_Tensorflow_Tensorflow Gpu - Fatal编程技术网

如何将TensorFlow图（模型）拆分到多个GPU上以避免OOM？

tensorflow

如何将TensorFlow图（模型）拆分到多个GPU上以避免OOM？,tensorflow,tensorflow-gpu,Tensorflow,Tensorflow Gpu,所以我用TensorFlow r1.2实现了这个非常大和深入的模型，运行在一个NVIDIA Tesla k40上，内存为12GB。该模型由多个RNN、一组权重和嵌入矩阵以及偏差向量组成。当我启动培训计划时，首先需要大约2-3个小时来构建模型，然后由于OOM问题而崩溃。我试图将批大小减少到每批1个数据样本，但仍然遇到同样的问题如果我在谷歌上搜索tensorflow多个gpu，我发现的例子主要集中在通过并行模型设计利用多个gpu，这意味着让每个gpu运行相同的图形，让CPU计算总梯度，从而传播回每

所以我用TensorFlow r1.2实现了这个非常大和深入的模型，运行在一个NVIDIA Tesla k40上，内存为12GB。该模型由多个RNN、一组权重和嵌入矩阵以及偏差向量组成。当我启动培训计划时，首先需要大约2-3个小时来构建模型，然后由于OOM问题而崩溃。我试图将批大小减少到每批1个数据样本，但仍然遇到同样的问题

如果我在谷歌上搜索tensorflow多个gpu，我发现的例子主要集中在通过并行模型设计利用多个gpu，这意味着让每个gpu运行相同的图形，让CPU计算总梯度，从而传播回每个参数
我知道一个可能的解决方案可能是在内存更大的GPU上运行该模型。但我想知道是否有办法将我的图形（模型）按顺序拆分成不同的部分，并将它们分配给不同的GPU？
上的官方指南在“使用多个GPU”中向您展示了该示例。您只需要在不同的上下文中创建操作；这些节点仍将添加到同一个图中，但它们将使用设备指令进行注释，指示它们应该运行的位置。例如：

with tf.device("/gpu:0"): net0 = make_subnet0() with tf.device("/gpu:1"): net1 = make_subnet1() result = combine_subnets(net0, net1)

[gstreamer]相关文章推荐

播放avi文件的gstreamer代码挂起 gstreamer

如何使用gstreamer创建新蒸汽？ gstreamer

gstreamer c代码中使用“的内部数据流错误”；加法器；元素？ gstreamer

在gstreamer管道中设置视频分辨率 gstreamer

使用gstreamer从dvblast到HLS的流式传输 gstreamer

Gstreamer 无法在raspberry pi 2上使用gst play命令播放暂停 gstreamer

使用Gstreamer的流式冰铸 gstreamer

合并两条gstreamer管道 gstreamer

Gstreamer 1.0-创建自定义消息/事件/信号 gstreamer

现在，为appsrc设置上限的几种方法中，哪一种是好的和合适的？我在Linux上用C++编写实验性的gStuffER应用程序。在尝试创建一个appsrc来发出算法生成的帧时，我在线找到了几种设置appsrc源pad caps的方法。我想有些已经过时了。有些可能适用于旧的gst 0.1，不使用。我发现示例代码没有标记为gstreamer版本。这是一堆乱七八糟的东西。我发现的大多数方法都可以在下面的代码库中进行总结： source = gst_element_factory_make("ap gstreamer

GStreamer:VBI数据流解码 gstreamer

使用gstreamer获取rtsp输入和输出rtmp gstreamer

随机文章推荐

Server MAMP服务器错误500 server

Server Grub错误无此类设备：* server centos

Server 模拟服务器-客户端TCP通信 server

Server 如何将virtual box linux服务器复制到我自己的服务器？ server

elasticsearch vserver安装错误 server linux-kernel

错误：没有可用端口启动\u server.js server centos polymer

Server Perforce服务器更新后存储库消失 server perforce

Server 服务器上的Redis在工作几天后损坏 server redis

Server 触发器命令不作为非操作员在符号中工作 server

Server 对于刚安装pivpn（wireguard）的已连接客户端，没有internet server

Server 重新安装后连接到pg admin上的服务器 server

如何在重定向到MVC客户端应用程序视图时将附加数据从identity server传递到客户端 server

[tensorflow]相关推荐

TensorFlow不写入事件
Tensorflow

在Tensorflow中，当使用QueueRunner时，如何为enqueue op提供数据？
Tensorflow

Tensorflow 用于神经网络训练的瞌睡数据集
Tensorflow

Tensorflow 添加辍学（tf.nn.dropout）将导致Nan
Tensorflow

Tensorflow 模型未能在Cloud ML引擎上加载，但在本地工作
Tensorflow

Tensorflow 在错误的时间调用发电机（keras）
Tensorflow Keras

TENSORFLOW在没有GPU的机器上运行，无法仅在CPU上运行
Tensorflow

Tensorflow Dataset.map、Dataset.prefetch和Dataset.shuffle中缓冲区大小的含义
Tensorflow

Tensorflow 未定义的符号：Ztin10传感器流量8Opkernele
Tensorflow

如何使用tensorflow纠正keras的此自定义损失函数？
Tensorflow Machine Learning Keras

Tensorflow `tf.data.Dataset.map`是否保留输入顺序？
Tensorflow

如何在tensorflow keras api中获取自定义损失函数的内部变量？
Tensorflow Keras

如何将pytorch adaptive_avg_pool2d方法转换为keras或tensorflow
Tensorflow Keras Deep Learning Pytorch

Tensorflow 如何使用tf.metrics计算多标签分类的准确度？
Tensorflow

Tensorflow 在模型配置文件中分配版本标签失败
Tensorflow

Tensorflow 如何解决可训练假在Keras中不起作用的问题？
Tensorflow Keras Deep Learning

Tensorflow 为什么赢了'；训练CNN时，准确度不会提高吗？
Tensorflow Keras

scikit学习模型部署在tensorflow服务中
Tensorflow Scikit Learn

Tensorflow从每行随机取样
Tensorflow

Tensorflow 与训练时的表现相比，深度Q学习模型在加载时表现非常差
Tensorflow Machine Learning Keras

将此代码从tensorflow 1移植到tensorflow 2
Tensorflow

Tensorflow-分配器（GPU\U 0\U bfc）在尝试分配时内存不足
Tensorflow

Tensorflow 在BERT模型中，输入ID、输入掩码和段ID变量来自何处？
Tensorflow Nlp

在TensorFlow 1.15中使用BiLSTM CRF实现CRF层
Tensorflow Keras Deep Learning

Tensorflow tf.where（）在处理张量时表现不符合预期
Tensorflow

Tensorflow Keras ImageDataGenerator:PIL.UnidentifiedImageError
Tensorflow Keras Deep Learning Computer Vision

Tensorflow 如何修复非OK状态：GpuLaunchKernel状态：Internal：无效配置参数错误？
Tensorflow

Tensorflow 冻结后存在Batchnorm层，用于从DeeplabV3+；模特儿，这个可以吗？
Tensorflow

Tensorflow 如何使用可变自动编码器作为特征提取器？
Tensorflow Machine Learning Keras

ImageDataGenerator tensorflow.keras.preprocessing.image中的预处理函数未应用
Tensorflow Machine Learning

Tags

Log4j Powerbi Streaming Acumatica Hive Xamarin Symfony Odoo Twitter Bootstrap Ruby On Rails 3 Openlayers Parameters Error Handling Binary Ionic2 C# 4.0 Webview Flask Cloud Foundry Next.js Datatables Database Internet Explorer 8 Gcc Heroku Smalltalk Google Chrome Zend Framework2 Unit Testing Python Nosql Cmd Google Colaboratory Maps Actionscript Functional Programming Performance Laravel 4 Stripe Payments Uitableview Maven Cakephp Webpack Azure Ad B2c Angularjs Algorithm Yii Discord.js Cron Virtualbox Open Source Apache Pig Pascal Wpf Ios4 Highcharts Magento Elm Antlr4 Postman Ignite Docker Compose Jekyll Actionscript 3 Awk Sencha Touch Abap Math Spring Integration Python Sphinx Iis Data Binding Postgresql Oracle11g Routes Routing Optimization Talend Grid Apache Nifi Javafx Indexing Glsl Apache Zookeeper Drupal 7 Printing Ecmascript 6 Passwords Blazor Jquery Mobile Struts2 Compiler Errors Sql Server 2008 Wso2 Junit Html5 Canvas Netlogo Xcode4 Ansible Xml Arm Racket Chart.js Apache Tfs Jar Silverlight 4.0 Google Calendar Api Leaflet Office365 Excel Sublimetext3 Subsonic Combobox Windows Phone Nativescript Numpy Transactions Notepad++ Asp Classic Prestashop Lisp Crystal Reports Exception Handling Internationalization Apache Spark Ssas Xquery Active Directory Wxpython Sorting Azure Sql Database Doctrine Julia Google App Maker Solr Deep Learning Keras Centos Web Applications Layout Sms Jersey Isabelle Rdf C++11 Here Api Lucene Dictionary Airflow Ajax Pdf Less Tridion Keycloak Localization Nlp Join Sap Caching Gmail Tinymce Path Bison R Verilog Autocomplete Input Bluetooth For Loop Sql Server Glassfish Sugarcrm Com Vector Google Compute Engine Windows Phone 8 Sqlite Hash Inheritance Monitoring Qt4 Kdb Sails.js Zsh Opengl Appium Jmeter Codeigniter Jquery Terminal Checkbox Iis 7 Selenium Webdriver Mfc Hbase Uwp Calendar Text Java 8 Eclipse Plugin

Copyright © 2024. All Rights Reserved by - Fatal编程技术网