Python 如果找不到word,Keras嵌入层如何工作?

Python 如果找不到word,Keras嵌入层如何工作?,python,keras,Python,Keras,我正在使用Keras嵌入层进行文本分类。当我尝试使用model.predictAPI进行预测时,如果训练数据集中不存在单词,它是如何工作的 我知道嵌入层是一个表查找。那么,如果没有找到关键字(测试样本中的单词),它将如何处理 编辑:这就是我如何预处理数据以预测 sequences = tokenizer.texts_to_sequences(['this is random car text']) data = pad_sequences(sequences, maxlen=MAX_SEQUEN

我正在使用Keras嵌入层进行文本分类。当我尝试使用
model.predict
API进行预测时,如果训练数据集中不存在单词,它是如何工作的

我知道嵌入层是一个表查找。那么,如果没有找到关键字(测试样本中的单词),它将如何处理

编辑:这就是我如何预处理数据以预测

sequences = tokenizer.texts_to_sequences(['this is random car text'])
data = pad_sequences(sequences, maxlen=MAX_SEQUENCE_LENGTH)
model.predict(np.array(data))

预训练模型还对标记器对象进行了pickle处理,以便在测试过程中对文本进行编码,得到与训练语料库中存在的单词相同的编码编号。

最好将其视为矩阵乘法,如果测试单词不存在于训练数据中,并且您没有使用任何嵌入层的迁移学习,那么输出将是随机的。这是假设我正确理解了您,您并不意味着单词超出了输入维度的范围(词汇表的大小)在这种情况下,我99%肯定会出现一些异常不,我的意思是它超出了输入词汇的范围。我使用的是一个预先训练好的模型,我是在这个模型上预测的。因此,训练数据集中可能不包括专有名词和其他单词。没有提出任何异常,也没有任何错误。你说的很奇怪,请包含代码,我需要看看你是如何为嵌入(输入)层准备数据的