Machine learning 不平衡等级f1分数含义_Machine Learning_Classification_Precision Recall_Imbalanced Data

Machine learning 不平衡等级f1分数含义

machine-learning

Machine learning 不平衡等级f1分数含义,machine-learning,classification,precision-recall,imbalanced-data,Machine Learning,Classification,Precision Recall,Imbalanced Data,大家好在这个模型中，f1分数不太适合预测1班，一个少数族裔我的想法是，如果模型能很好地预测0级，为什么我们不把问题转过来预测0级呢。因为只有2个类，如果它不是0类，那么它就是1类换句话说，如果模型可以将数据标识为类0，那么它肯定不是类1（特别是当类0的精度为1时）。这意味着该模型仍然表现良好这样行吗？为什么不呢非常感谢。你是凭直觉说模型真的学到了0课。在这种情况下（数据不平衡），这些分数（高回忆/高精度）可能有点决定性，意义不大让我给你举个例子。如果你指定一个盲人对红苹果和橙苹果进行

大家好

在这个模型中，f1分数不太适合预测1班，一个少数族裔

我的想法是，如果模型能很好地预测0级，为什么我们不把问题转过来预测0级呢。因为只有2个类，如果它不是0类，那么它就是1类

换句话说，如果模型可以将数据标识为类0，那么它肯定不是类1（特别是当类0的精度为1时）。这意味着该模型仍然表现良好

这样行吗？为什么不呢

非常感谢。

你是凭直觉说模型真的学到了0课。在这种情况下（数据不平衡），这些分数（高回忆/高精度）可能有点决定性，意义不大

让我给你举个例子。如果你指定一个盲人对红苹果和橙苹果进行分类（例如，你有99个红苹果和1个绿苹果作为你的数据）。现在，当你给他一个红苹果（他不知道它是什么颜色）时，他只是随意地说“红色”，你会很高兴，并给他一个奖励（从ML的角度来看，减少损失）。所以现在他知道说“红色”会给他一个奖励，所以现在他利用这种行为，一直说“红色”（虽然他会错过一个“绿色”苹果，但这并不能解释他得到的所有奖励）。现在，如果你不知道这个人是盲人，你可以说“我可以用他作为苹果分类器，因为他对“红色”苹果非常了解，我可以在它不是“红色”苹果时颠倒他的分类。”。但你知道这是一个盲人，他不知道“红”苹果是不是“红”苹果

我们可以这样想我们的模型，当我们给它一个任务时，它的任务是减少损失，所以如果它有漏洞，它就会利用任何漏洞。所以当它得到不平衡的数据时，它知道总是给出0类（多数类）的预测会减少损失，所以它就是这样做的。如果你从几何角度考虑，你已经得到了所有这些点的两种颜色（不同的类别），现在你有了一条线来分隔它们（决策边界），如果你把这条线画得很远，并说右边的点（数据集的所有点所在的位置）是类别0（多数类别）左边的所有点都是1级（少数族裔）。然后这个模型也会产生0类的高精度分数，这告诉我们，当模型预测0类时，我们真的可以信任它（这就是精度度量的意思），但我们真的可以吗？正如我们所知，它实际上没有学到任何东西

这些就是问题所在，由于数据不平衡，我们的成本分布也会出现偏差，这妨碍了模型的严格学习。

Wow！非常感谢您的详细解释和示例！！我真的很感激！很高兴它帮助了你。嗨，你是怎么做到的？啊，我看到了！！！

          precision    recall  f1-score   support
Class 0       1.00      0.98      0.99    125000
Class 1       0.33      0.84      0.47      1500