Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/279.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python LSTM-分离隐藏状态_Python_Lstm_Recurrent Neural Network - Fatal编程技术网

Python LSTM-分离隐藏状态

Python LSTM-分离隐藏状态,python,lstm,recurrent-neural-network,Python,Lstm,Recurrent Neural Network,所以我开始研究RNN,特别是LSTM,有一部分理论我就是不明白 当你堆叠LSTM单元时,我看到每个人是如何将隐藏状态从历史中分离出来的,但这对我来说毫无意义,难道LSTM不应该使用历史中的隐藏状态来做出更好的预测吗 我阅读了文档,但仍然不清楚,因此欢迎您提供任何解释如果您答对了,LSTM中的隐藏状态将用作内存。但是这个问题出现了,我们应该学习它们吗?不,不需要学习隐藏状态,因此我们将其分离,让模型使用这些值,但不计算梯度 如果不拆离,则渐变将非常大。正确无误,LSTM中的隐藏状态将用作内存。但是

所以我开始研究RNN,特别是LSTM,有一部分理论我就是不明白

当你堆叠LSTM单元时,我看到每个人是如何将隐藏状态从历史中分离出来的,但这对我来说毫无意义,难道LSTM不应该使用历史中的隐藏状态来做出更好的预测吗


我阅读了文档,但仍然不清楚,因此欢迎您提供任何解释

如果您答对了,LSTM中的隐藏状态将用作内存。但是这个问题出现了,我们应该学习它们吗?不,不需要学习隐藏状态,因此我们将其分离,让模型使用这些值,但不计算梯度


如果不拆离,则渐变将非常大。

正确无误,LSTM中的隐藏状态将用作内存。但是这个问题出现了,我们应该学习它们吗?不,不需要学习隐藏状态,因此我们将其分离,让模型使用这些值,但不计算梯度


如果不分离,则渐变将非常大。

您可能希望使其更精确一些,并包括示例说明您的意思。在RNN理论中没有“将国家与历史分离”这样的东西(这就是你在本文中提到的)。我想你说的是pytorch代码或类似的东西,在这种情况下,(代码)示例也会很有用。你可能想让它更精确一点,并包括你的意思的示例。在RNN理论中没有“将国家与历史分离”这样的东西(这就是你在本文中提到的)。我想你说的是pytorch代码或类似的东西,在这种情况下,(代码)示例也会很有用。谢谢!这就是我要寻找的解释(在Pytorch中)我应该将隐藏状态设置为缓冲区吗?似乎一个分离的变量也能很好地工作。我不怎么用Pytorch编码,但我会先尝试分离。@zheyuanwang谢谢!这就是我要寻找的解释(在Pytorch中)我应该将隐藏状态设置为缓冲区吗?似乎分离变量也能很好地工作。我不怎么用Pytorch编码,但我会先尝试分离。@zheiyuanwang