Tensorflow LSTM-不平衡数据集-召回率低_Tensorflow_Neural Network

Tensorflow LSTM-不平衡数据集-召回率低

tensorflow neural-network

Tensorflow LSTM-不平衡数据集-召回率低,tensorflow,neural-network,Tensorflow,Neural Network,我的LSTM有问题，有点卡住了。问题是我的准确度是.60-0.80，但是召回率非常低0.002-0.20 我有一个imabalance数据集问题要解决，我正在使用tf.nn.weighted\u cross\u entropy\u和\u logits，但它似乎仍然不起作用其中self.pos\u class\u权重为 class1weight = max(0.00001, (np.size(y)) / (float(np.sum(y)) + 0.0001)) 没关系，我验证过了 losses

我的LSTM有问题，有点卡住了。问题是我的准确度是.60-0.80，但是召回率非常低0.002-0.20

我有一个imabalance数据集问题要解决，我正在使用tf.nn.weighted\u cross\u entropy\u和\u logits，但它似乎仍然不起作用

其中self.pos\u class\u权重为

class1weight = max(0.00001, (np.size(y)) / (float(np.sum(y)) + 0.0001))

没关系，我验证过了

losses = tf.nn.weighted_cross_entropy_with_logits(logits=logits, targets=y, pos_weight=self.pos_class_weight)
loss = tf.reduce_mean(losses)
self.train_op = tf.train.AdamOptimizer(learning_rate=0.005).minimize(loss)

不知何故，我的直觉是，上面处理imabalnce数据集问题的方法是不正确的

问题是，我甚至试图故意过度健身（不是这样）。我只是想增加召回率，让精度降低，但现在还没有实现，即使在增加隐藏层大小和使用堆叠LSTM层之后

我遗漏了一些非常基本的东西，但不知道它是什么，有谁能帮助我，或者给我指出一个资源，该资源最好使用LSTM来处理不平衡数据集问题。

您是否考虑过分层抽样来解决不平衡数据集问题？不能，这是一个序列标签问题，就像在非结构化文本中，我标记了一些实体一样。因此，我无法处理班级规模或他们作为输入的顺序