Tensorflow 在输入尺寸为x的情况下,KERA如何产生不同尺寸y的输出?

Tensorflow 在输入尺寸为x的情况下,KERA如何产生不同尺寸y的输出?,tensorflow,keras,deep-learning,lstm,recurrent-neural-network,Tensorflow,Keras,Deep Learning,Lstm,Recurrent Neural Network,我不熟悉神经网络。我正在阅读大量的指南和教程,它们将从输入大小不同于输出大小的lstm层开始 例如,model.add(LSTM(100,输入_形=(20,1))-> 在执行之前-> 添加(稠密(80,activation='relu'))等 据推测,这里lstm的输出层大小为100,而输入层只有20 对于稠密层,我可以想象它是如何工作的,因为有大量的图形描述了这一点,但是lstm如何生成与输入大小完全不同的输出层呢 同样重要的是,输入(比如说20)能有效地给出输出值的范围是什么?任何价值

我不熟悉神经网络。我正在阅读大量的指南和教程,它们将从输入大小不同于输出大小的lstm层开始

例如,model.add(LSTM(100,输入_形=(20,1))-> 在执行之前->

  • 添加(稠密(80,activation='relu'))等
据推测,这里lstm的输出层大小为100,而输入层只有20 对于稠密层,我可以想象它是如何工作的,因为有大量的图形描述了这一点,但是lstm如何生成与输入大小完全不同的输出层呢

  • 同样重要的是,输入(比如说20)能有效地给出输出值的范围是什么?任何价值都有意义吗

输出大小可以是任何大小。例如,在输入256长度的字嵌入和输出1000长度的字嵌入的情况下,它稍微遵循以下步骤:

  • 嵌入到LSTM中(在这里,我忽略批处理和序列长度;在一个时间步中只嵌入一个单词)
  • 权重矩阵(Waa、Way、Wax等已初始化):这些矩阵形状取决于您给出的输出大小(例如上面的100)
  • 根据LSTM语义,遵循所有需要的计算
  • 生成1000矢量长度的输出

  • 给定输入的输出大小没有限制,所以我认为你的问题是基于一个误解。“如何”只是一个矩阵乘法,我明白了。非常感谢。我不知道我的问题是如何冒犯了任何人,但还好。