Machine learning Keras:优化特定于Tweet的预训练单词嵌入层

Machine learning Keras:优化特定于Tweet的预训练单词嵌入层,machine-learning,neural-network,deep-learning,keras,word-embedding,Machine Learning,Neural Network,Deep Learning,Keras,Word Embedding,我正在做一个分类任务,我想把推特分成5个不同的类别。我将遵循构建模型的步骤,但希望修改此模型中的嵌入层。我没有将初始化的权重传递到嵌入层,而是使用word2vec权重,我希望在数据集中查找每个tweet,这样我就可以为每个tweet构建一个矩阵(tweet\u words x vector\u维度) 例如,推特“我听腻了这次选举#tuningout”将表示为如下矩阵: vector_dim1 vector_dim2 vector_dim3 ... vector_dimN I'm

我正在做一个分类任务,我想把推特分成5个不同的类别。我将遵循构建模型的步骤,但希望修改此模型中的
嵌入层。我没有将初始化的权重传递到
嵌入层,而是使用word2vec权重,我希望在数据集中查找每个tweet,这样我就可以为每个tweet构建一个矩阵(tweet\u words x vector\u维度)

例如,推特“我听腻了这次选举#tuningout”将表示为如下矩阵:

     vector_dim1  vector_dim2  vector_dim3 ... vector_dimN
I'm  value1       value2       value3          valueN
so   value1       value2       value3          valueN
tired                 (... and so on...)
of
hearing
about
this
election
#tuningout
我之所以这样做是因为我有针对不同国家分别学习的嵌入,我想根据tweet的位置查找特定的嵌入,而不是将权重从联合嵌入传递到
嵌入
层进行初始化。我可以将这样一个矩阵直接传递给具有以下Keras体系结构的非常简单的LSTM:

model = Sequential()
# layer here would normally be:
# model.add(Embedding())
model.add(LSTM(width, input_shape=(max_len, 100), dropout_W=0.2, dropout_U=0.2))
model.add(Dense(class_size))
model.add(Activation(activation))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
但是,与链接中的示例相比,这种架构的缺点是不能进一步优化
嵌入层。是否有一种方法可以将每个tweet的矩阵传递给嵌入层,以便进一步优化,如示例中所示?谢谢你的阅读