Python 如何将注意层应用于LSTM模型_Python_Tensorflow_Keras_Attention Model

Python 如何将注意层应用于LSTM模型

python tensorflow keras

Python 如何将注意层应用于LSTM模型,python,tensorflow,keras,attention-model,Python,Tensorflow,Keras,Attention Model,我正在做一个语音情感识别机的训练我希望对模型应用一个注意层。这说明很难理解 def bi_duo_LSTM_model(X_train, y_train, X_test,y_test,num_classes,batch_size=68,units=128, learning_rate=0.005, epochs=20, dropout=0.2, recurrent_dropout=0.2): class myCallback(tf.keras.callbacks.Callba

我正在做一个语音情感识别机的训练

我希望对模型应用一个注意层。这说明很难理解

def bi_duo_LSTM_model(X_train, y_train, X_test,y_test,num_classes,batch_size=68,units=128, learning_rate=0.005, epochs=20, dropout=0.2, recurrent_dropout=0.2):
    
    class myCallback(tf.keras.callbacks.Callback):

        def on_epoch_end(self, epoch, logs={}):
            if (logs.get('acc') > 0.95):
                print("\nReached 99% accuracy so cancelling training!")
                self.model.stop_training = True

    callbacks = myCallback()

    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.Masking(mask_value=0.0, input_shape=(X_train.shape[1], X_train.shape[2])))
    model.add(tf.keras.layers.Bidirectional(LSTM(units, dropout=dropout, recurrent_dropout=recurrent_dropout,return_sequences=True)))
    model.add(tf.keras.layers.Bidirectional(LSTM(units, dropout=dropout, recurrent_dropout=recurrent_dropout)))
    #     model.add(tf.keras.layers.Bidirectional(LSTM(32)))
    model.add(Dense(num_classes, activation='softmax'))

    adamopt = tf.keras.optimizers.Adam(lr=learning_rate, beta_1=0.9, beta_2=0.999, epsilon=1e-8)
    RMSopt = tf.keras.optimizers.RMSprop(lr=learning_rate, rho=0.9, epsilon=1e-6)
    SGDopt = tf.keras.optimizers.SGD(lr=learning_rate, momentum=0.9, decay=0.1, nesterov=False)

    model.compile(loss='binary_crossentropy',
                  optimizer=adamopt,
                  metrics=['accuracy'])

    history = model.fit(X_train, y_train,
                        batch_size=batch_size,
                        epochs=epochs,
                        validation_data=(X_test, y_test),
                        verbose=1,
                        callbacks=[callbacks])

    score, acc = model.evaluate(X_test, y_test,
                                batch_size=batch_size)

    yhat = model.predict(X_test)

    return history, yhat

如何将其应用于我的模型

use\u scale

、

因果关系

和

退出

都是参数吗

如果在

注意层中有辍学
，那么既然在LSTM层中有辍学
，我们该如何处理它呢？
注意可以解释为软向量检索

您有一些查询向量。对于每个查询，您都希望检索一些

值，以便计算它们的加权

其中，权重是通过将查询与键进行比较获得的（键的数量必须与值的数量相同，并且通常是相同的向量）


在序列到序列模型中，查询是解码器状态，键和值是解码器状态
在分类任务中，您没有这样的显式查询。最简单的方法是训练一个“通用”查询，用于从隐藏状态收集相关信息（类似于最初描述的内容）
如果您将问题处理为序列标签，将标签不是分配给整个序列，而是分配给各个时间步，那么您可能需要使用“自我关注”层。
谢谢，我已经观看了一些关于“自我关注”的视频。有没有教程或者好的示例代码可以参考我的案例？还是必须基于数学来构造代码？