Machine learning Keras：优化特定于Tweet的预训练单词嵌入层_Machine Learning_Neural Network_Deep Learning_Keras_Word Embedding

Machine learning Keras：优化特定于Tweet的预训练单词嵌入层

machine-learning neural-network deep-learning keras

Machine learning Keras：优化特定于Tweet的预训练单词嵌入层,machine-learning,neural-network,deep-learning,keras,word-embedding,Machine Learning,Neural Network,Deep Learning,Keras,Word Embedding,我正在做一个分类任务，我想把推特分成5个不同的类别。我将遵循构建模型的步骤，但希望修改此模型中的嵌入层。我没有将初始化的权重传递到嵌入层，而是使用word2vec权重，我希望在数据集中查找每个tweet，这样我就可以为每个tweet构建一个矩阵（tweet\u words x vector\u维度）例如，推特“我听腻了这次选举#tuningout”将表示为如下矩阵： vector_dim1 vector_dim2 vector_dim3 ... vector_dimN I'm

我正在做一个分类任务，我想把推特分成5个不同的类别。我将遵循构建模型的步骤，但希望修改此模型中的

嵌入层。我没有将初始化的权重传递到嵌入层，而是使用word2vec权重，我希望在数据集中查找每个tweet，这样我就可以为每个tweet构建一个矩阵（tweet\u words x vector\u维度）
例如，推特“我听腻了这次选举#tuningout”将表示为如下矩阵：
     vector_dim1  vector_dim2  vector_dim3 ... vector_dimN
I'm  value1       value2       value3          valueN
so   value1       value2       value3          valueN
tired                 (... and so on...)
of
hearing
about
this
election
#tuningout

我之所以这样做是因为我有针对不同国家分别学习的嵌入，我想根据tweet的位置查找特定的嵌入，而不是将权重从联合嵌入传递到嵌入
层进行初始化。我可以将这样一个矩阵直接传递给具有以下Keras体系结构的非常简单的LSTM：
model = Sequential()
# layer here would normally be:
# model.add(Embedding())
model.add(LSTM(width, input_shape=(max_len, 100), dropout_W=0.2, dropout_U=0.2))
model.add(Dense(class_size))
model.add(Activation(activation))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

但是，与链接中的示例相比，这种架构的缺点是不能进一步优化嵌入层。是否有一种方法可以将每个tweet的矩阵传递给嵌入层，以便进一步优化，如示例中所示？谢谢你的阅读