Machine learning 不平衡等级f1分数含义

Machine learning 不平衡等级f1分数含义,machine-learning,classification,precision-recall,imbalanced-data,Machine Learning,Classification,Precision Recall,Imbalanced Data,大家好 在这个模型中,f1分数不太适合预测1班,一个少数族裔 我的想法是,如果模型能很好地预测0级,为什么我们不把问题转过来预测0级呢。因为只有2个类,如果它不是0类,那么它就是1类 换句话说,如果模型可以将数据标识为类0,那么它肯定不是类1(特别是当类0的精度为1时)。这意味着该模型仍然表现良好 这样行吗?为什么不呢 非常感谢。你是凭直觉说模型真的学到了0课。在这种情况下(数据不平衡),这些分数(高回忆/高精度)可能有点决定性,意义不大 让我给你举个例子。如果你指定一个盲人对红苹果和橙苹果进行

大家好

在这个模型中,f1分数不太适合预测1班,一个少数族裔

我的想法是,如果模型能很好地预测0级,为什么我们不把问题转过来预测0级呢。因为只有2个类,如果它不是0类,那么它就是1类

换句话说,如果模型可以将数据标识为类0,那么它肯定不是类1(特别是当类0的精度为1时)。这意味着该模型仍然表现良好

这样行吗?为什么不呢


非常感谢。

你是凭直觉说模型真的学到了0课。在这种情况下(数据不平衡),这些分数(高回忆/高精度)可能有点决定性,意义不大

让我给你举个例子。如果你指定一个盲人对红苹果和橙苹果进行分类(例如,你有99个红苹果和1个绿苹果作为你的数据)。现在,当你给他一个红苹果(他不知道它是什么颜色)时,他只是随意地说“红色”,你会很高兴,并给他一个奖励(从ML的角度来看,减少损失)。所以现在他知道说“红色”会给他一个奖励,所以现在他利用这种行为,一直说“红色”(虽然他会错过一个“绿色”苹果,但这并不能解释他得到的所有奖励)。现在,如果你不知道这个人是盲人,你可以说“我可以用他作为苹果分类器,因为他对“红色”苹果非常了解,我可以在它不是“红色”苹果时颠倒他的分类。”。但你知道这是一个盲人,他不知道“红”苹果是不是“红”苹果

我们可以这样想我们的模型,当我们给它一个任务时,它的任务是减少损失,所以如果它有漏洞,它就会利用任何漏洞。所以当它得到不平衡的数据时,它知道总是给出0类(多数类)的预测会减少损失,所以它就是这样做的。如果你从几何角度考虑,你已经得到了所有这些点的两种颜色(不同的类别),现在你有了一条线来分隔它们(决策边界),如果你把这条线画得很远,并说右边的点(数据集的所有点所在的位置)是类别0(多数类别)左边的所有点都是1级(少数族裔)。然后这个模型也会产生0类的高精度分数,这告诉我们,当模型预测0类时,我们真的可以信任它(这就是精度度量的意思),但我们真的可以吗?正如我们所知,它实际上没有学到任何东西


这些就是问题所在,由于数据不平衡,我们的成本分布也会出现偏差,这妨碍了模型的严格学习。

Wow!非常感谢您的详细解释和示例!!我真的很感激!很高兴它帮助了你。嗨,你是怎么做到的?啊,我看到了!!!
          precision    recall  f1-score   support
Class 0       1.00      0.98      0.99    125000
Class 1       0.33      0.84      0.47      1500