Neural network 提高卷积神经网络的精度

Neural network 提高卷积神经网络的精度,neural-network,tensorflow,conv-neural-network,tensorboard,Neural Network,Tensorflow,Conv Neural Network,Tensorboard,我试图训练一个卷积神经网络来分类句子。我把代码从 代码在我的一个数据集中运行良好。然而,在另一个数据集上,它的性能非常差。两个数据集在数量和句子长度方面具有可比性。对于性能较差的数据集,我注意到损失函数在步骤之后会减少。蓝色表示训练集,读数表示测试集。 以下是准确度: 如您所见,测试集上的损耗值减小,但精度值几乎相同。 你能建议我怎么修吗? 非常感谢。你能试着降低学习率吗 尝试使用指数衰减学习率——开始时学习率很大(比如0.1),然后随着迭代次数的增加而变慢。我目前使用的Adam optimi

我试图训练一个卷积神经网络来分类句子。我把代码从

代码在我的一个数据集中运行良好。然而,在另一个数据集上,它的性能非常差。两个数据集在数量和句子长度方面具有可比性。对于性能较差的数据集,我注意到损失函数在步骤之后会减少。蓝色表示训练集,读数表示测试集。

以下是准确度: 如您所见,测试集上的损耗值减小,但精度值几乎相同。 你能建议我怎么修吗?
非常感谢。

你能试着降低学习率吗

尝试使用指数衰减学习率——开始时学习率很大(比如0.1),然后随着迭代次数的增加而变慢。

我目前使用的Adam optimizer学习率是1e-4。我试过1e-5,现在它的收敛速度非常慢。听起来不错。你可以把它弄大一点,让它快一点。请告诉我们进展如何。每个数据集中有多少个类别标签,每个类别标签之间的文本性质有什么区别?@jmp对于这两个数据集,类数为4。事实上,这两个数据集都是从twitter收集的tweet。性能良好的数据集是我自己通过twitter stream API创建的,另一个来自网站。区别在于,我不使用任何过滤器来消除自动机器人(如天气或招聘)发出的推文。对于网站上的数据集,他们只保留普通人的推文。两个数据集的示例数量几乎相同,我采用了相同的预处理技术。