Tensorflow 在没有时间分布的情况下,这个顺序模型是如何工作的?

Tensorflow 在没有时间分布的情况下,这个顺序模型是如何工作的?,tensorflow,keras,lstm,Tensorflow,Keras,Lstm,我按照教程制作了一个Keras LSTM模型,它有80个时间步,每个时间步看80个单词,每次预测1个单词。现在,我正在使用函数式API创建一个不同的LSTM模型,我不确定我的另一个模型在没有时间分布层的情况下是如何工作的。我将在下面列出第一个LSTM模型。在没有时间分布层的情况下,下一层如何在同一批中的不同时间点进行80个单独的预测 model = keras.Sequential() model.add(keras.layers.Embedding(15938, 150, input_leng

我按照教程制作了一个Keras LSTM模型,它有80个时间步,每个时间步看80个单词,每次预测1个单词。现在,我正在使用函数式API创建一个不同的LSTM模型,我不确定我的另一个模型在没有时间分布层的情况下是如何工作的。我将在下面列出第一个LSTM模型。在没有时间分布层的情况下,下一层如何在同一批中的不同时间点进行80个单独的预测

model = keras.Sequential()
model.add(keras.layers.Embedding(15938, 150, input_length=80))
model.add(keras.layers.CuDNNLSTM(1024))
model.add( keras.layers.Dense(15938, activation='softmax') ) 

arrayOfArraysToTrainOnInputF = np.empty( [80, 80], dtype=int )
arrayOfArraysToTrainOnTargetF = np.empty( [80, 15938], dtype=int )

model.train_on_batch( 
arrayOfArraysToTrainOnInputF,arrayOfArraysToTrainOnTargetF )

我找到了答案。嵌入操作导致输入的大小为(80,80150),这意味着80个时间步的80个样本

我找到了答案。嵌入操作导致输入的大小为(80,80150),这意味着80个时间步的80个样本