Tensorflow 利用LSTM嵌入词防止文本分类过度拟合目标：使用用户输入的问题（如问题）识别类标签应答系统）从大PDF文件中提取数据，并需要预测基于用户输入的页码主要用于政策文件，其中用户对策略有疑问，需要显示特定页面号码_Tensorflow_Keras_Lstm_Text Classification_Word Embedding

Tensorflow 利用LSTM嵌入词防止文本分类过度拟合目标：使用用户输入的问题（如问题）识别类标签应答系统）从大PDF文件中提取数据，并需要预测基于用户输入的页码主要用于政策文件，其中用户对策略有疑问，需要显示特定页面号码

tensorflow keras

Tensorflow 利用LSTM嵌入词防止文本分类过度拟合目标：使用用户输入的问题（如问题）识别类标签应答系统）从大PDF文件中提取数据，并需要预测基于用户输入的页码主要用于政策文件，其中用户对策略有疑问，需要显示特定页面号码,tensorflow,keras,lstm,text-classification,word-embedding,Tensorflow,Keras,Lstm,Text Classification,Word Embedding,以前的执行情况：应用了弹性搜索，但精确度非常低，因为用户可以输入任何文本，如“我需要”=“想要” 数据集信息：数据集包含每行、文本（或段落）和标签（页码）。这里的数据集很小，我只有500行目前的执行情况：在Keras和后端is中使用LSTM的应用词嵌入（手套）张量流撅嘴应用活性调节应用L2 W_正则化器（从0.1到0.001）从10到600应用不同的nb_期将手套数据的嵌入尺寸从100更改为300 适用于转换成小写删除英语中的停止词堵塞删除号码删除URL和

以前的执行情况：应用了弹性搜索，但精确度非常低，因为用户可以输入任何文本，如“我需要”=“想要”

数据集信息：数据集包含每行、文本（或段落）和标签（页码）。这里的数据集很小，我只有500行

目前的执行情况：

在Keras和后端is中使用LSTM的应用词嵌入（手套）张量流
撅嘴
应用活性调节
应用L2 W_正则化器（从0.1到0.001）
从10到600应用不同的nb_期
将手套数据的嵌入尺寸从100更改为300

适用于

转换成小写
删除英语中的停止词
堵塞
删除号码
删除URL和IP地址

结果：测试数据（或验证数据）的准确度为23%，但列车数据的准确度为91%

代码：

除了简单地减少参数，例如嵌入大小和某些层中的单元数量外，还可以调整LSTM中的重复丢失

LSTM似乎很容易过度适应（我已经读过）

然后，您可以将

dropout

和

recurrent_dropout

用作每个

LSTM

层的参数

具有任意数字的示例：

x = LSTM(num_lstm, return_sequences=True, W_regularizer=l2(0.001), recurrent_dropout=0.4)(embedded_sequences)
x = Dropout(0.5)(x)
x = LSTM(64,dropout=0,5, recurrent_dropout=0,3)(x)

其他原因可能是错误或数据不足：

您是否尝试过将测试和验证数据混合在一起，并创建新的训练集和验证集
你在训练数据中有多少句话？你在试着用小电视机吗？使用整个集合或尝试数据扩充（创建新的句子及其分类-但这对于文本来说可能非常棘手）

辍学

经常性辍学

W_regularizer

x = LSTM(num_lstm, return_sequences=True, W_regularizer=l2(0.001), recurrent_dropout=0.4)(embedded_sequences)
x = Dropout(0.5)(x)
x = LSTM(64,dropout=0,5, recurrent_dropout=0,3)(x)