Python 在优化三重态损耗时，PyTorch如何计算反向通过？_Python_Pytorch - Fatal编程技术网

Python 在优化三重态损耗时，PyTorch如何计算反向通过？

python pytorch

Python 在优化三重态损耗时，PyTorch如何计算反向通过？,python,pytorch,Python,Pytorch,我正在Pytorch中实现一个三重网络，其中3个实例（子网络）共享相同的权重。由于权重是共享的，所以我将其实现为一个单实例网络，该网络被调用三次以生成锚定、正嵌入和负嵌入。通过优化模型来学习嵌入。下面是一个小片段进行说明： from dependencies import * model = SingleSubNet() # represents each instance in the triplet net for epoch in epochs: for anch, po

我正在Pytorch中实现一个三重网络，其中3个实例（子网络）共享相同的权重。由于权重是共享的，所以我将其实现为一个单实例网络，该网络被调用三次以生成锚定、正嵌入和负嵌入。通过优化模型来学习嵌入。下面是一个小片段进行说明：

from dependencies import *
model = SingleSubNet() # represents each instance in the triplet net

for epoch in epochs:
        for anch, pos, neg in enumerate(train_loader):
                optimizer.zero_grad()
                fa, fp, fn = model(anch), model(pos), model(neg)
                loss = triplet_loss(fa, fp, fn)
                loss.backward()
                optimizer.step()
                # Do more stuff ...

我的完整代码按预期工作。但是，我不明白在这种情况下，

loss.backward（）

如何计算梯度。我很困惑，因为在每个学习步骤中有3个损失梯度（梯度公式）。我假设在执行
optimizer.step（）
之前对梯度求和。但是从这个角度来看，如果梯度相加，它们将相互抵消，并产生零更新项。当然，这不是真的，因为网络最终学习到了有意义的嵌入
提前谢谢

[pytorch]相关文章推荐

pytorch中conv的默认权重初始值设定项是什么？ pytorch

Pytorch 运行时错误：DataLoader工作进程被信号：非法指令杀死。 pytorch

Pytorch 如何使用Pytork'；s grid_sample（）？ pytorch

Pytorch 基于矩阵乘法的文档检索 pytorch

Pytorch：将输入规范化添加到模型（划分层） pytorch

PyTorch-只保存模型结构，不带权重，然后加载并训练它 pytorch

Pytorch 使用torch.autograd执行程序时出错；不推荐使用带有非静态转发方法的传统自动加载功能； pytorch

“的定义；总目；Pytorch变压器模块中的多点注意 pytorch

Pytorch Pyrotch中使用反向法计算中间梯度 pytorch

PyTorch：两个二进制面具联盟？ pytorch

联合训练两个网络时，Cuda与pytorch内存不足问题 pytorch

随机文章推荐

Localization OpenCms本地化 localization

Localization 2011年Web应用程序日期时间本地化最佳实践 localization

Localization Xcode4最佳实践：英语xib/nib更新。如何继续？ localization xcode4

Localization 使用ISO 639-2或ISO 639-3作为权威语言列表？ localization

Localization struts中的MessageResources不适用于亚洲语言…但返回？？？？？？相反 localization

Localization 如何扩展felogin'；什么是locallang？ localization typo3

Localization 本地化平台和翻译服务 localization

Localization 如何在框架中注入我自己的CultureSelector实现 localization orchardcms

Localization wolkenkit：如何实现本地化 localization internationalization

[python]相关推荐

Python 'a'和'a[：]之间有什么区别`
Python

Python 从文本文档中读取信息
Python Import

pygame/python中的文本输入框
Python Text Input

Python if-else-if-else子句序列的逻辑等价性
Python Logic

Python Django URL.py错误-某些模式不起作用
Python Django Web

Python 在Tkinter主循环期间录制OpenCV视频
Python Opencv Video Tkinter

Python I'；我试图使用pymongo对mondo db中的字段执行文本搜索，但得到的TypeError:skip必须是int的一个实例
Python Mongodb

Python:regexp语句切分
Python Regex

当文本中存在语法相同的非占位符时，如何在python中设置占位符？
Python

Python Marshmallow:schema.loads（）返回嵌套模式的错误
Python Python 2.7

Python Xcode 8不'；t启动：加载插件失败
Python Ios Xcode

如何在CANTERA Python模块中反转程序adiabetic.py，使其输入adiabetic温度并给出输出入口温度？
Python

Python 从txt文件捕获链接
Python Python 3.x

用于打印带有键的最大值的python字典
Python

在生产服务器上部署和管理python脚本的好方法是什么？
Python Memory Management Windows 10

在Python中的列表中查找3个最相似的值
Python Sorting Math

Python 迭代器耗尽后，迭代器执行挂起
Python Loops

Python 为什么我的输出数据框形状不是1459 x 2而是1460 x 2
Python Pandas Machine Learning Scikit Learn

Python 如何生成总和为1的随机值列表
Python

Python 将NumPy 2D数组与列（1D数组）连接起来
Python Arrays Numpy

如何在Python中创建字典元组
Python Dictionary

Python 如何确定dict中的哪个键有子dict？
Python Python 3.x Dictionary Recursion

Python 保存opencv视频
Python Python 3.x Opencv

Python Django管理列表视图中的序列号
Python Django

Python 如何使用joblib.Parallel（）返回生成器？
Python Parallel Processing

Python 辛集的化简
Python

Python 将大列表存储到文本文件中
Python List

Python 从Excel单元格中向后计数删除特定数字字符
Python Excel Pandas Numpy Dataframe

Python 我的awscli在lambda函数中不工作
Python Amazon Web Services Ubuntu Aws Lambda

为什么我的Python代码认为变量是str，而它应该是int？
Python String

Tags

Properties Ssl Liferay Mqtt Wxpython Database Design Automation Osgi Design Patterns Swift3 Wolfram Mathematica Internet Explorer Php Unity3d Sed Three.js Embedded Configuration Testng Apache Camel Stm32 Jetty Drupal 7 Iframe Asp.net Mvc 2 Exchange Server Syntax Outlook Imagemagick Ssas Exception Odata Jenkins Nhibernate Webrtc Bison Nativescript Wso2 Google Maps Hive Pine Script Deployment Notifications Dictionary Google Chrome Devtools Svg Perl Weblogic Protocol Buffers Parse Platform Logstash Sharepoint Wcf Omnet++ Methods Nlp Tree Ffmpeg Hyperlink Coffeescript Marklogic Mfc Pdf Data Structures Xamarin.ios Visual Studio 2015 Netsuite Titanium Google Maps Api 3 Hash Telegram Dojo Apache Pig Curl Grafana Fortran User Interface Azure Google Cloud Firestore Grep Shiny Mpi Geometry Umbraco Google Chrome Extension Google Cloud Dataflow Html Pytorch Terraform Amazon Dynamodb Jupyter Notebook Fullcalendar Rspec Jmeter Snmp Reporting Services Http Reference Mdx Boost Tfs Binding Openstack Udp Jqgrid Jakarta Ee Devexpress Plugins Rest Protractor Mono C Ios5 Ide Xpath Sql Server 2012 Multithreading Jersey Orm Menu File Asp.net Mvc 3 Vba Pandas Powershell Sql Server Filesystems Google Drive Api Templates Visual Studio 2013 Gtk Struct Scripting Webstorm Vb.net File Io Google App Maker Inno Setup Clearcase Postgresql Doctrine Orm Jdbc Oracle Apex Functional Programming Clojure Activerecord Sequelize.js Shopify Gnuplot Svn Mapreduce Streaming Blazor Isabelle Sublimetext2 Windows Amazon S3 Material Ui Plone Visual Studio 2010 Iis Soap Groovy Spotify Nosql Printing Ftp Version Control Prestashop Jekyll Jquery Plugins Websocket Firefox Addon Install4j Graph Variables Jboss Compiler Errors Magento Aurelia Ubuntu Jira Spring Integration Entity Framework 4 Loops Sql Server 2008 R2 Azure Service Fabric Calendar Django Rest Framework Silverlight 4.0 Serial Port If Statement Neo4j Continuous Integration Bazel Exception Handling Activemq Windows 7 Pointers Actionscript Random

Copyright © 2024. All Rights Reserved by - Fatal编程技术网