Machine learning 微观与宏观与加权F1分数_Machine Learning_Multiclass Classification_Imbalanced Data

Machine learning 微观与宏观与加权F1分数

machine-learning

Machine learning 微观与宏观与加权F1分数,machine-learning,multiclass-classification,imbalanced-data,Machine Learning,Multiclass Classification,Imbalanced Data,我有一个不平衡的多分类数据集。我计算了微观F1、宏观F1和加权F1。我认为在预测不平衡数据集的总体性能时，宏是最好的。但是，一些人说，若你们想看到整体性能，就使用Micro，而另一些人说，Micro只是在数据集不平衡的情况下才能看到为什么在不平衡的数据集中使用Micro 何时使用微观、宏观和加权？换言之，这些手段是在什么情况下使用的谢谢你的帮助。先看看这个数据不平衡一直是一个需要处理的大问题。下面是一个不平衡数据的二进制分类示例。整体准确度看起来不错，但当你看个人分数时，你会发现这

我有一个不平衡的多分类数据集。我计算了微观F1、宏观F1和加权F1。我认为在预测不平衡数据集的总体性能时，宏是最好的。但是，一些人说，若你们想看到整体性能，就使用Micro，而另一些人说，Micro只是在数据集不平衡的情况下才能看到

为什么在不平衡的数据集中使用Micro

何时使用微观、宏观和加权？换言之，这些手段是在什么情况下使用的

谢谢你的帮助。

先看看这个

数据不平衡一直是一个需要处理的大问题。下面是一个不平衡数据的二进制分类示例。整体准确度看起来不错，但当你看个人分数时，你会发现这是一个巨大的失败！对于这类数据，我总是在得出结果之前检查小班的分数。你可以考虑在这种数据中增加数据。有很好的库来处理不平衡的数据。下面是Python中的一个很好的示例

最后，Micro-avg使用个体真阳性和假阳性以及假阴性。微AVG仅仅是PRISICIO+回忆的意思，并且<强>不考虑数据中的类< /强>的比例。因此，微平均能更好地反映不平衡数据的精度
注:
以下是sklearn网站的解释：
'micro'：通过计算总的真阳性、假阴性和假阳性来全局计算指标
“宏”：计算每个标签的指标，并找到它们的未加权平均值。这不考虑标签不平衡
如果您查看宏，它会说：这不考虑标签不平衡。因此，如果数据不平衡，最好使用micro

宏观平均值不能更好地反映不平衡数据吗？因为，宏平均值计算F1的平均值。所以我认为宏平均显示整体性能。但我不确定。如果我错了，请告诉我。我编辑了答案。请参阅备注部分。你知道什么时候使用加权吗？
#Confusion Matrix: [[3808 0] [ 182 2]] precision recall f1-score support 0 0.95 1.00 0.98 3808 1 1.00 0.01 0.02 184 accuracy 0.95 3992 macro avg 0.98 0.51 0.50 3992 weighted avg 0.96 0.95 0.93 3992