Python 了解LSTM模型的摘要
我有下面的LSTM模型。有人能帮我理解模型的摘要吗 a参数是如何计算的 b我们没有价值 c下拉菜单附近的参数为什么为0Python 了解LSTM模型的摘要,python,deep-learning,lstm,Python,Deep Learning,Lstm,我有下面的LSTM模型。有人能帮我理解模型的摘要吗 a参数是如何计算的 b我们没有价值 c下拉菜单附近的参数为什么为0 model = Sequential() model.add(LSTM(64, return_sequences=True, recurrent_regularizer=l2(0.0015), input_shape=(timestamps, input_dim))) model.add(Dropout(0.5)) model.add(LSTM(64, recurrent_r
model = Sequential()
model.add(LSTM(64, return_sequences=True, recurrent_regularizer=l2(0.0015), input_shape=(timestamps,
input_dim)))
model.add(Dropout(0.5))
model.add(LSTM(64, recurrent_regularizer=l2(0.0015), input_shape=(timesteps,input_dim)))
model.add(Dense(64, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dense(n_classes, activation='softmax'))
model.summary()
以下是输入、时间戳和x_序列
timesteps=100
input_dim= 6
X_train=1120
总结如下:
Layer (type) Output Shape Param #
=================================================================
lstm_1 (LSTM) (None, 100, 64) 18176
_________________________________________________________________
dropout_1 (Dropout) (None, 100, 64) 0
_________________________________________________________________
lstm_2 (LSTM) (None, 64) 33024
_________________________________________________________________
dense_1 (Dense) (None, 64) 4160
_________________________________________________________________
dense_2 (Dense) (None, 64) 4160
_________________________________________________________________
dense_3 (Dense) (None, 6) 390
=================================================================
Total params: 59,910
Trainable params: 59,910
Non-trainable params: 0
这里回答了你的部分问题 简单地说,LSTM模型有这么多参数的原因是,您的模型中有大量数据,需要训练许多权重来拟合模型 辍学层没有参数,因为辍学层中没有权重。一个退出层所做的只是给出一个神经元在测试过程中不被包含的%几率。在这种情况下,您选择了50%。除此之外,在退出层中没有任何配置 如何计算参数? 嗯!!。输入维为6,第一层LSTM中的隐藏神经元为64 因此,第一个LSTM层采用这种形式的输入[64初始化隐藏状态+6输入]。所以我们可以说输入维是70[t-1处的64个隐藏状态+t处的6个电流输入] 现在是计算部分 参数数量=输入尺寸*隐藏单位+偏差
= [64 (randomly initialized hidden state dimension) + 6 (input dimension)]*64( hidden neurons ) + 64 ( bias 1 for each hidden neurons)
= (64+6)*64+64
对于一个FFNN=4544
但是LSTM有4个FFNN,所以只需将其乘以4即可
总可培训参数=4*4544
= 18176
辍学层没有任何参数
我不确定你说的是哪种价值
你有什么不明白的?谢谢。因此,第一个lstm层具有4 x 64x6+64x64+64==18176。我不了解下一个lstm的参数,但我会找到它。