Python 输入的内容应该是什么;译码器;“的;“顺序对顺序”;模型

Python 输入的内容应该是什么;译码器;“的;“顺序对顺序”;模型,python,machine-learning,keras,keras-layer,rnn,Python,Machine Learning,Keras,Keras Layer,Rnn,我正在开发一个用于文本生成的序列到序列模型()。我没有在解码器端使用“教师强制”,即t0处解码器的输出在t1时被送入解码器的输入 现在,实际上,解码器(LSTM/GRU)的输出通过一个密集层,该密集层生成单词的索引,该索引被视为解码器的输出。 但是,为了将输出馈送到下一层,我们应该将h\u t(即解码器的输出/解码器的隐藏状态)馈送到下一步,还是下一个单词的单词嵌入是正确的选择?简短的回答是:可能两者都有,但隐藏状态h\u t是必要的 输入隐藏状态h_t需要将整个句子(不仅仅是前一个单词)的信息

我正在开发一个用于文本生成的序列到序列模型()。我没有在解码器端使用“教师强制”,即t0处解码器的输出在t1时被送入解码器的输入

现在,实际上,解码器(LSTM/GRU)的输出通过一个密集层,该密集层生成单词的索引,该索引被视为解码器的输出。


但是,为了将输出馈送到下一层,我们应该将h\u t(即解码器的输出/解码器的隐藏状态)馈送到下一步,还是下一个单词的单词嵌入是正确的选择?

简短的回答是:可能两者都有,但隐藏状态h\u t是必要的

输入隐藏状态h_t需要将整个句子(不仅仅是前一个单词)的信息从一个解码器层传递到下一个解码器层

输入所选单词的嵌入并不重要,但这可能是一个好主意。这允许解码器根据之前被迫做出的选择进行调整