序列的损失函数（在Tensorflow 2.0中）_Tensorflow_Deep Learning_Loss Function - Fatal编程技术网

序列的损失函数（在Tensorflow 2.0中）

tensorflow deep-learning

序列的损失函数（在Tensorflow 2.0中）,tensorflow,deep-learning,loss-function,Tensorflow,Deep Learning,Loss Function,我正在研究从英语到德语的句子翻译问题。所以最终输出是一个德国序列，我需要检查我的预测有多好我在tensorflow教程中发现了以下损失函数： loss_object = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True, reduction='none') def loss_function(real, pred): mask = tf.math.logical_not(tf.math.equal(real

我正在研究从英语到德语的句子翻译问题。所以最终输出是一个德国序列，我需要检查我的预测有多好

我在tensorflow教程中发现了以下损失函数：

loss_object = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True, reduction='none')

def loss_function(real, pred):
    mask = tf.math.logical_not(tf.math.equal(real, 0))
    loss_ = loss_object(real, pred)

    mask = tf.cast(mask, dtype=loss_.dtype)
    loss_ *= mask

    return tf.reduce_mean(loss_)

但我不知道这个函数做什么。我知道（也许我错了）我们不能直接使用序列的SparseCategoricAlCross熵，我们必须做一些操作。但在上面的代码中，我看到SparseCategoricalCrossentropy以简单的方式用于序列输出。为什么?

mask

变量的作用是什么？你能解释一下代码吗

编辑：教程-

在

掩码=tf.math.logical\u not（tf.math.equal（real，0））

中的

掩码负责填充
因此，在你的一批人中，你会有不同长度的句子，你会用0
填充使所有句子的长度相等（想想我有一个苹果
v/s这是在阳光下踢足球的好日子
）
但是，在损失计算中包含0
填充部分是没有意义的-因此，它首先要研究0
的指数，然后使用乘法将它们的损失贡献计算为0




[deep learning]相关文章推荐



                                                        
Deep learning keras中的可变长度输出
deep-learningkeras 
Deep learning 如何在deeplearning（keras）培训输入数据中预处理类别信息？
deep-learningkeras 
Deep learning 为什么向图像数据中添加噪声会导致CNN回归学习失败
deep-learning 
Deep learning EPHO的参数和计算时间随着输入图像通道的增加而增加？
deep-learning 
Deep learning 深度学习4j中的时代和迭代
deep-learning 
Deep learning 为什么tensorflow代码需要高GPU内存和低GPU util计算，而加密挖掘需要低内存使用和高计算？
deep-learningblockchain 
Deep learning Pyrotch交叉熵会导致不匹配的批大小
deep-learningneural-networkpytorch 
Deep learning 如何加载数据以及如何使用pytorch进行数据扩充
deep-learningpytorch 
Deep learning 在CNN深度学习中，为什么基于相同图像对过滤器进行不同的训练？
deep-learning 
Deep learning 变压器的查询、键和值是在通过线性层之前还是之后进行拆分？
deep-learningnlppytorch 
Deep learning 获取inceptionV3的输入维度不匹配的运行时错误
deep-learningpytorch 
Deep learning 量化模型的QAT输出节点得到相同的最小-最大范围
deep-learning 
Deep learning 数据格式和步幅
deep-learningpytorch 
Deep learning Pytorch全局修剪并没有减少模型的大小
deep-learningcomputer-visionpytorch 
Deep learning 使用预测分割模板进行流域后处理的理想步骤是什么？
deep-learning 
                                       





随机文章推荐



                                                        
如何根据线程策略和参数调整嵌入式Grizzly实例上的Jersey部署
jersey 
如何使用Jersey 2.0/Dropbox API从上载的文件中删除MIME边界
jersey 
将Jersey中的Jackson与多个已配置的ObjectMapper一起使用
jersey 
Hystrix仪表板不适用于Jersey端点
jersey 
Jersey 生成包含ContainerRequestContext的JSONP#abortWith
jersey 
Jersey客户端Post PUT InputStream“输入流”；“400错误请求”；
jersey


                                        

                                        
                                        


                                                
                                                        [tensorflow]相关推荐
                                                        
Tensorflow 从tf.train.AdamOptimizer获取当前学习速率
									Tensorflow
							 
分布式Tensorflow的WebUI？
									Tensorflow
							 
Tensorflow Concat错误：形状不匹配
									Tensorflow
							 
在我使用张量切片后，如何修复该问题，tensorflow优化器将崩溃？
									Tensorflow
							 
TensorFlow GPU，CUDA_错误\u在tf上启动失败。one_hot（）
									Tensorflow
							 
Tensorflow 关于将单个图像的多个修补程序放入单个小批量中
									Tensorflow
							 									Deep Learning
							 									Keras
							 
Tensorflow 数字相同的代码片段会产生截然不同的结果
									Tensorflow
							 
具有多个类的最后一个输出层。由Tensorflow支持的Keras
									Tensorflow
							 									Neural Network
							 									Deep Learning
							 									Keras
							 
如何在tensorflow中创建独立的LSTM单元？
									Tensorflow
							 
如何解决no'；估计量'；在tensorflow中？
									Tensorflow
							 
Tensorflow中的张量是否具有非连续记忆？
									Tensorflow
							 									Memory
							 
Tensorflow Keras-是否有函数读取人脸图像的预测概率并为未知人脸设置阈值
									Tensorflow
							 									Keras
							 
TensorFlow构建选项，用于禁用不受支持GPU的半精度
									Tensorflow
							 
如何使用Tensorflow 2.0获得可重复的结果？
									Tensorflow
							 									Keras
							 
打开tf.keras.Model层
将tensorflow导入为tf
输入_形状=（2242243）
输入=tf.keras.layers.Input（形状=输入\形状）
base_model=tf.keras.applications.ResNet50（输入_shape=input_shape，include_top=False，weights='imagenet'）
#获取conv4的输出
hidden_layer=基本_模型。获取_层（'conv4_block6_out'）。输出
stack=tf.
									Tensorflow
							 									Keras
							 
如何部署TensorFlow概率模型
									Tensorflow
							 
我可以在Maya、Blender中导入tensorflow和keras吗
									Tensorflow
							 									Artificial Intelligence
							 
tensorflow gpu 2.2.0rc1损耗非常高-发生了什么变化？
									Tensorflow
							 
Tensorflow 尝试使用40x40px图像自定义训练MobilenetV2-训练后结果错误
									Tensorflow
							 									Machine Learning
							 
Tensorflow 使用LearningRateSchedule时要适应的多个调用
									Tensorflow
							 
Tensorflow 我需要帮助。。UnicodeDecodeError:&x27；utf-8'；编解码器可以'；在位置0处对字节0xc1进行解码：起始字节无效
									Tensorflow
							 
Tensorflow 如何将稀疏张量传递到SageMaker上的Keras模型
									Tensorflow
							 									Keras
							 
Tensorflow 将自定义属性从TF op传递到TFL（MLIR）
									Tensorflow
							 									Llvm
							 
Tensorflow 如何将重量从本地计算机加载到google colab笔记本
									Tensorflow
							 									Keras
							 									Google Colaboratory
							 
Tensorflow tf.contrib.layers.flatten（x）张量流的替代函数
									Tensorflow
							 
Tensorflow 为什么完全相同的keras模型对同一环境中的相同输入数据预测不同的结果
									Tensorflow
							 									Keras
							 
Tensorflow ModuleNotFoundError:没有名为'；注册'；在google colab中
									Tensorflow
							 
Tensorflow '；val#U精度'；和'；val#U acc'；在keras中绘制学习曲线时，两者都给出了错误
									Tensorflow
							 									Matplotlib
							 									Keras
							 									Plot
							 									Deep Learning
							 
Tensorflow概率中每个实验可能结果数不同的分类分布
									Tensorflow
							 
Tensorflow 索引[3]=36826不在[036720]中
									Tensorflow
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Cocos2d X
Fullcalendar
Sms
Aem
Hybris
Ant
Orm
Knockout.js
Automated Tests
Version Control
Instagram
Android Ndk
Dll
Sas
Function
Sbt
For Loop
Apache Pig
Linkedin
Utf 8
Ide
Moodle
Angular Material
Arrays
Git
Iis
Webgl
Jquery
Google Maps Api 3
Primefaces
Oop
Windows Phone
Grafana
Selenium
Ansible
Stm32
C#
Flask
Windows 7
Syntax
Node.js
Mvvm
Lua
Maven
Itext
Asp.net Mvc 3
Boost
Nestjs
Jhipster
Solr
Sqlalchemy
Push Notification
Groovy
Phpunit
Dotnetnuke
Plsql
Asp.net Web Api
Certificate
Xmpp
Gnuplot
Pip
Jquery Plugins
Shopify
Io
Protocol Buffers
Excel
Pine Script
Blockchain
Sql
File
Download
Gstreamer
Intellij Idea
View
Visual Studio 2008
Parallel Processing
Silverstripe
Netty
Select
Makefile
Docker Compose
Plone
Discord.js
Clearcase
Webstorm
Sml
Sharepoint 2010
Sitecore
Install4j
Ibm Mobilefirst
Keycloak
Reactjs
Yocto
Cocoa Touch
Editor
Visual Studio 2017
Vb6
Openstack
F#
Open Source
Algorithm
Doctrine
Exception Handling
Mips
Compiler Errors
Collections
Apache Flink
Programming Languages
Netsuite
Wicket
Cmake
Airflow
Appium
Unicode
Ibm Mq
Google Chrome Devtools
Asp.net Core Mvc
Frameworks
Wxpython
Flash
Dynamics Crm 2011
Permissions
System Verilog
Pytorch
Encryption
Twitter Bootstrap 3
Ajax
Dialogflow Es
Imagemagick
Amazon Web Services
Julia
Abap
Sip
Web Scraping
Windows Mobile
Types
Amazon Cloudformation
Continuous Integration
Cocoa
Numpy
Bootstrap 4
Visual Studio
Monitoring
Properties
Assembly
Concurrency
Fortran
Ssl
Ssrs 2008
Hyperlink
Azure Data Factory
Jupyter Notebook
Pointers
Magento
Ssas
Hazelcast
Scroll
Interface
Snmp
Routing
Javafx
Sharepoint 2013
Jasper Reports
Twitter Bootstrap
Akka
Content Management System
Amazon Dynamodb
Proxy
Graph
Authentication
Checkbox
Oauth
Sublimetext3
Shell
Chef Infra
Combobox
Tfs
Android Emulator
Processing
R
Zsh
Rspec
Redis
Gremlin
Libgdx
Chart.js
Csv
Php
Gdb
Linq To Sql
Docker
Ipad
Pandas
Gps
Sequelize.js
Architecture
Here Api
Jsf
Parse Platform
Audio
Iphone


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网