Tensorflow 非平衡张量流模型的权重策略

Tensorflow 非平衡张量流模型的权重策略,tensorflow,classification,weighted,Tensorflow,Classification,Weighted,我想从一个不平衡的数据集中训练一个tensorflow DNNClasifier模型。每个样本都有一个“质量”值,表示样本的相对相关性。我想我可以用权重来表示这种相关性。我读到权重特征与损失相乘。在这种情况下,“良好”样品的重量可能较低。准确吗?你说的“好样品”是什么意思?在不平衡的情况下,您将有两种样本—数量较多的样本和数量较少的样本 重量越大的应该越轻,重量越小的应该越重。我们基本上是通过扩大损失使模型更加关注少量样本。正如Pankaj Kabra正确指出的那样,不清楚“好”样本的含义。如果

我想从一个不平衡的数据集中训练一个tensorflow DNNClasifier模型。每个样本都有一个“质量”值,表示样本的相对相关性。我想我可以用权重来表示这种相关性。我读到权重特征与损失相乘。在这种情况下,“良好”样品的重量可能较低。准确吗?

你说的“好样品”是什么意思?在不平衡的情况下,您将有两种样本—数量较多的样本和数量较少的样本


重量越大的应该越轻,重量越小的应该越重。我们基本上是通过扩大损失使模型更加关注少量样本。

正如Pankaj Kabra正确指出的那样,不清楚“好”样本的含义。如果你想给他们更多的重视,你应该更重视这些例子;相反,如果这些是数量最多的样本,并且你不希望网络仅仅因为样本较多而偏向于它们,那么你就需要减少它们的权重

最经典的方法有两种:

  • 根据其类别,乘以每个样品的重量损失。这意味着,如果你正在评估数量较多的类别的损失,你必须乘以其值以获得较小的重量;反之亦然,如果你处理的是最小的类,那么权重必须更大。例如,您可以使用以下方式计算的权重:
    w\u class=1.0/(此类的样本数)
  • 样本平衡小批量,其中两类的数量相同
  • “好”的样品意味着我想偏爱它们,所以我不得不超重。谢谢你的回答