Neural network PyTorch小批量，何时调用optimizer.zero_grad（）_Neural Network_Pytorch - Fatal编程技术网

Neural network PyTorch小批量，何时调用optimizer.zero_grad（）

neural-network pytorch

Neural network PyTorch小批量，何时调用optimizer.zero_grad（）,neural-network,pytorch,Neural Network,Pytorch,当我们使用mini-batch时，我应该在开始迭代之前调用optimizer.zero\u grad（）？还是在迭代中？我认为第二个代码是正确的，但我不确定 nb_epochs = 20 for epoch in range(nb_epochs + 1): optimizer.zero_grad() # THIS PART!! for batch_idx, samples in enumerate(dataloader):

当我们使用mini-batch时，我应该在开始迭代之前调用

optimizer.zero\u grad（）

？还是在迭代中？我认为第二个代码是正确的，但我不确定

nb_epochs = 20
    for epoch in range(nb_epochs + 1):
      optimizer.zero_grad() # THIS PART!!
      for batch_idx, samples in enumerate(dataloader):
        
        
        x_train, y_train = samples
        
        prediction = model(x_train)
    
        
        cost = F.mse_loss(prediction, y_train)
    
        
        
        cost.backward()
        optimizer.step()
    
        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader),
            cost.item()
            ))

或

哪一个是正确的？唯一的区别是优化器的位置。默认情况下，每次在计算图上调用

.backward（）

，零梯度（梯度都会累积

在第一个片段中，您将在每个历元中重置一次渐变，以便所有渐变将随时间累积其值。总计
len（数据加载器）
累积梯度，仅在下一个历元开始时重新加载梯度在第二段中，您做的是正确的，即在每次向后传递后重置渐变
所以你的假设是对的
有些情况下需要累积梯度，但大多数情况下并非如此

nb_epochs = 20 for epoch in range(nb_epochs + 1): for batch_idx, samples in enumerate(dataloader): x_train, y_train = samples prediction = model(x_train) optimizer.zero_grad() #THIS PART!! cost = F.mse_loss(prediction, y_train) cost.backward() optimizer.step() print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format( epoch, nb_epochs, batch_idx+1, len(dataloader), cost.item() ))

[pytorch]相关文章推荐

Pytorch 政府有何建议?；操作员在Pytork中做了什么？为什么它会改变形状？ pytorch

Pytorch 在实验室中，CUDA不能用于火炬 pytorch google-colaboratory

pytorch中未将输入张量移动到GPU pytorch

Pytorch 如何使用AX运行并行测试？ pytorch

Pytorch 如何了解型号'；输入大小是否为onnx？ pytorch

Pytorch Pytork：使用torch.nn.Conv2d卷积单通道图像 pytorch

Pytorch 预期步幅为单个整数值或1个值的列表，以匹配卷积维度，但获得步幅=[1，1] pytorch

Pytorch RuntimeError：张量（7）的扩展大小必须与非单态维度3的现有大小（128）匹配 pytorch

Pytorch Resnet实现：forward（）接受1个位置参数，但给出了2个 pytorch

PyTorch：理解运行时错误：梯度计算所需的变量之一已通过就地操作修改 pytorch

pytorch张量的维数延拓 pytorch

Pytorch：如何创建一个随机整数张量，其中某个百分比具有某个值？例如，25%为1，其余为0 pytorch

Pytorch 传统torchtext 0.9.0 pytorch

pytorch:运行时错误：CUDA内存不足。有足够的GPU内存 pytorch

PyTorch数据加载器“；“数据加载”；GPU内存概念 pytorch

随机文章推荐

Google maps 我应该为浏览器还是PC编码？（车队管理） google-maps

Google maps 谷歌地图应用程序，使用数据API或我自己的数据存储 google-maps

Google maps 从谷歌地图API获取邻里边界 google-maps google-maps-api-3

Google maps 如何更改谷歌地图中KML和平铺覆盖的分层？ google-maps google-maps-api-3

Google maps 如果没有Lat和Long，我如何在Google地图上显示数据？ google-maps google-maps-api-3

Google maps 黑白打印谷歌地图 google-maps google-maps-api-3

Google maps 在嵌入式google地图中实现反弹标记 google-maps

Google maps 谷歌地图v3 jquery手机获取中心纬度和经度 google-maps jquery-mobile google-maps-api-3

Google maps 在谷歌地图上显示推文 google-maps google-maps-api-3 twitter

Google maps 如何在windows phone 8应用程序中添加谷歌地图 google-maps windows-phone-7 c#-4.0 windows-phone-8

Google maps 使用ios7 CoreLocation创建谷歌地图链接 google-maps ios7

Google maps Google maps places/geocode API缺少place的数据 google-maps google-maps-api-3

Google maps 如何在谷歌地图上添加自定义图标？ google-maps

Google maps 我只想在谷歌地图上看到标记，而不是地图 google-maps google-maps-api-3

Google maps 创建谷歌地图应用程序 google-maps android-studio google-maps-api-3

Google maps Jekyll-谷歌地图服务器API未显示正确地址 google-maps google-maps-api-3 jekyll

Google maps 中国国家电话线不能使用谷歌地图 google-maps

Google maps 谷歌地图API-地图在白天不显示 google-maps

Google maps 使用谷歌地图API的云功能 google-maps firebase

Google maps 删除谷歌地图上的所有标记？ google-maps

[neural network]相关推荐

Neural network matlab中的工具箱
Neural Network Matlab

Neural network 当我试图教授下一组训练输入时，我的神经网络忘记了最后一次训练
Neural Network

Neural network 遗传神经网络中的变异和交叉是什么？
Neural Network

Neural network 基于RELU的神经网络反向传播
Neural Network

Neural network 输出体积的大小（卷积神经网络）介绍
Neural Network

Neural network 如何将Tensorflow网络分成两部分，并保持梯度反向传播？
Neural Network Tensorflow

Neural network 是莱文伯格–；Marquardt是一种反向传播算法吗？
Neural Network

Neural network 卷积层降低了Keras的输出维数？
Neural Network Keras

Neural network 在NN属性中使用混合范围正确吗？一些[0,1]和一些[-1,1]
Neural Network

Neural network 如何规范化神经网络的fft值
Neural Network

Neural network 如何将输入数据集输入神经网络？
Neural Network

Neural network 如何培养深度学习网络
Neural Network Deep Learning

Neural network 自动编码器：解码器是编码器的镜像版本吗？
Neural Network

Neural network 人工神经网络中偏差的目的是什么？
Neural Network

Neural network 批处理如何同时包含正片和负片标签？
Neural Network Keras

Neural network 为什么这个语义分割网络在Pytorch中没有softmax分类层？
Neural Network Deep Learning Pytorch

Neural network 为什么神经网络损失函数总是正的
Neural Network

Neural network 创建一个三层神经网络，使权重矩阵正交？
Neural Network Deep Learning

Neural network 为什么LSTM对人工时间序列数据的性能不如简单的前馈神经网络
Neural Network Deep Learning

Neural network 为什么真阳性-假阴性分布总是相同的
Neural Network Pytorch

Neural network pytorch中设置权重的计算图
Neural Network Pytorch

Neural network 数学算子手写数据集
Neural Network Computer Vision

Tags

Puppet Ajax Asp.net Mvc 2 Opencv Akka Terminal Netsuite Core Data Sharepoint Winapi Geometry Ibm Mobilefirst Sdk Concurrency Silverlight 4.0 Lisp Docusignapi Character Encoding Performance Triggers Google Cloud Storage Pdf Multithreading Hadoop Parameters Google Cloud Firestore Colors Next.js Certificate Cors Adobe Utf 8 Cygwin Spring Security Here Api File Io Artificial Intelligence Swiftui Fonts Chart.js Sms Drupal 7 Caching Docker Algorithm Node.js Windows Discord Oauth Function Nunit Azure Sql Database Db2 Teamcity Aem Ffmpeg Forms Keras Activerecord Mips Server Scripting Sharepoint 2010 Xml Security Web Applications Continuous Integration Delphi Sql Server 2008 R2 Ruby On Rails Enums Paypal Animation Clearcase Macos Vim Npm Mfc Kernel Gatsby Typo3 Sass Ipad Arrays Spring Cloud Joomla Push Notification Apache Pig Tsql Streaming Functional Programming Modelica Join .net Core Python 2.7 Apache Xquery For Loop Excel Database Deployment Gcc Prometheus X86 Ckeditor Azure Coding Style Pyspark Latex Ionic Framework Qt Pip Sql Server 2005 Microsoft Graph Api Emacs Influxdb Elixir Applescript Netlogo Telerik Tensorflow Sap Parallel Processing Ios7 Twig Merge Asp.net Air Flash Tags Build Drools Mongodb Apache Camel Google Analytics Youtube Install4j Telegram Nestjs Configuration Sapui5 Pycharm Jquery Mobile Google Cloud Dataflow Odoo Image Pine Script Report C++ Cli Log4net Jersey Eclipse Rcp Jpa Scikit Learn Windows 7 Apache Zookeeper Entity Framework 4 Tcp Tableau Api Matlab Office Js Bootstrap 4 Virtual Machine Discord.py Binding Visual Studio 2015 Xamarin.forms Routing Dll Llvm Lotus Notes Mysql Ip Protractor Gps Sparql Sql Server 2012 Rdf EmptyTag Api Directory Facebook Graph Api Date Zend Framework Linq Collections Playframework Web Crawler Asp.net Web Api Ada Google Sheets Three.js Windbg Facebook Dialogflow Es Azure Devops Ocaml Grafana Express Calendar Class

Copyright © 2024. All Rights Reserved by - Fatal编程技术网