Tensorflow LSTM-不平衡数据集-召回率低

Tensorflow LSTM-不平衡数据集-召回率低,tensorflow,neural-network,Tensorflow,Neural Network,我的LSTM有问题,有点卡住了。问题是我的准确度是.60-0.80,但是召回率非常低0.002-0.20 我有一个imabalance数据集问题要解决,我正在使用tf.nn.weighted\u cross\u entropy\u和\u logits,但它似乎仍然不起作用 其中self.pos\u class\u权重为 class1weight = max(0.00001, (np.size(y)) / (float(np.sum(y)) + 0.0001)) 没关系,我验证过了 losses

我的LSTM有问题,有点卡住了。问题是我的准确度是.60-0.80,但是召回率非常低0.002-0.20

我有一个imabalance数据集问题要解决,我正在使用tf.nn.weighted\u cross\u entropy\u和\u logits,但它似乎仍然不起作用

其中self.pos\u class\u权重为

class1weight = max(0.00001, (np.size(y)) / (float(np.sum(y)) + 0.0001))
没关系,我验证过了

losses = tf.nn.weighted_cross_entropy_with_logits(logits=logits, targets=y, pos_weight=self.pos_class_weight)
loss = tf.reduce_mean(losses)
self.train_op = tf.train.AdamOptimizer(learning_rate=0.005).minimize(loss)
不知何故,我的直觉是,上面处理imabalnce数据集问题的方法是不正确的

问题是,我甚至试图故意过度健身(不是这样)。 我只是想增加召回率,让精度降低,但现在还没有实现,即使在增加隐藏层大小和使用堆叠LSTM层之后


我遗漏了一些非常基本的东西,但不知道它是什么,有谁能帮助我,或者给我指出一个资源,该资源最好使用LSTM来处理不平衡数据集问题。

您是否考虑过分层抽样来解决不平衡数据集问题?不能,这是一个序列标签问题,就像在非结构化文本中,我标记了一些实体一样。因此,我无法处理班级规模或他们作为输入的顺序