Tensorflow 在没有时间分布的情况下，这个顺序模型是如何工作的？_Tensorflow_Keras_Lstm

Tensorflow 在没有时间分布的情况下，这个顺序模型是如何工作的？

tensorflow keras

Tensorflow 在没有时间分布的情况下，这个顺序模型是如何工作的？,tensorflow,keras,lstm,Tensorflow,Keras,Lstm,我按照教程制作了一个Keras LSTM模型，它有80个时间步，每个时间步看80个单词，每次预测1个单词。现在，我正在使用函数式API创建一个不同的LSTM模型，我不确定我的另一个模型在没有时间分布层的情况下是如何工作的。我将在下面列出第一个LSTM模型。在没有时间分布层的情况下，下一层如何在同一批中的不同时间点进行80个单独的预测 model = keras.Sequential() model.add(keras.layers.Embedding(15938, 150, input_leng

我按照教程制作了一个Keras LSTM模型，它有80个时间步，每个时间步看80个单词，每次预测1个单词。现在，我正在使用函数式API创建一个不同的LSTM模型，我不确定我的另一个模型在没有时间分布层的情况下是如何工作的。我将在下面列出第一个LSTM模型。在没有时间分布层的情况下，下一层如何在同一批中的不同时间点进行80个单独的预测

model = keras.Sequential()
model.add(keras.layers.Embedding(15938, 150, input_length=80))
model.add(keras.layers.CuDNNLSTM(1024))
model.add( keras.layers.Dense(15938, activation='softmax') ) 

arrayOfArraysToTrainOnInputF = np.empty( [80, 80], dtype=int )
arrayOfArraysToTrainOnTargetF = np.empty( [80, 15938], dtype=int )

model.train_on_batch( 
arrayOfArraysToTrainOnInputF,arrayOfArraysToTrainOnTargetF )

我找到了答案。嵌入操作导致输入的大小为（80,80150），这意味着80个时间步的80个样本