Machine learning 微观与宏观与加权F1分数

Machine learning 微观与宏观与加权F1分数,machine-learning,multiclass-classification,imbalanced-data,Machine Learning,Multiclass Classification,Imbalanced Data,我有一个不平衡的多分类数据集。 我计算了微观F1、宏观F1和加权F1。 我认为在预测不平衡数据集的总体性能时,宏是最好的。 但是,一些人说,若你们想看到整体性能,就使用Micro,而另一些人说,Micro只是在数据集不平衡的情况下才能看到 为什么在不平衡的数据集中使用Micro 何时使用微观、宏观和加权? 换言之,这些手段是在什么情况下使用的 谢谢你的帮助。先看看这个 数据不平衡一直是一个需要处理的大问题。下面是一个不平衡数据的二进制分类示例。整体准确度看起来不错,但当你看个人分数时,你会发现这

我有一个不平衡的多分类数据集。 我计算了微观F1、宏观F1和加权F1。 我认为在预测不平衡数据集的总体性能时,宏是最好的。 但是,一些人说,若你们想看到整体性能,就使用Micro,而另一些人说,Micro只是在数据集不平衡的情况下才能看到

  • 为什么在不平衡的数据集中使用Micro
  • 何时使用微观、宏观和加权? 换言之,这些手段是在什么情况下使用的
  • 谢谢你的帮助。

    先看看这个

    数据不平衡一直是一个需要处理的大问题。下面是一个不平衡数据的二进制分类示例。整体准确度看起来不错,但当你看个人分数时,你会发现这是一个巨大的失败!对于这类数据,我总是在得出结果之前检查小班的分数。你可以考虑在这种数据中增加数据。有很好的库来处理不平衡的数据。下面是Python中的一个很好的示例

    最后,Micro-avg使用个体真阳性和假阳性以及假阴性。微AVG仅仅是PRISICIO+回忆的意思,并且<强>不考虑数据中的类< /强>的比例。因此,微平均能更好地反映不平衡数据的精度

    注:

    以下是sklearn网站的解释:

    'micro':通过计算总的真阳性、假阴性和假阳性来全局计算指标

    “宏”:计算每个标签的指标,并找到它们的未加权平均值。这不考虑标签不平衡

    如果您查看宏,它会说:这不考虑标签不平衡。因此,如果数据不平衡,最好使用micro


    宏观平均值不能更好地反映不平衡数据吗?因为,宏平均值计算F1的平均值。所以我认为宏平均显示整体性能。但我不确定。如果我错了,请告诉我。我编辑了答案。请参阅备注部分。你知道什么时候使用加权吗?
    #Confusion Matrix:
     [[3808    0]
     [ 182    2]]
                  precision    recall  f1-score   support
    
               0       0.95      1.00      0.98      3808
               1       1.00      0.01      0.02       184
    
        accuracy                           0.95      3992
       macro avg       0.98      0.51      0.50      3992
    weighted avg       0.96      0.95      0.93      3992