Scikit learn scikit中加权指标的含义:更大级别更重还是更小级别更重?

Scikit learn scikit中加权指标的含义:更大级别更重还是更小级别更重?,scikit-learn,metrics,imbalanced-data,Scikit Learn,Metrics,Imbalanced Data,我正在处理一个不平衡的数据集,并尝试使用验证度量来处理它。 在scikit docu中,我发现了以下加权平均值: 计算每个标签的指标,并找到其加权平均值 支持每个标签的真实实例数。这改变了 “宏观”来解释标签不平衡;这可能会导致F分数 这不是在精确性和召回率之间 通过支持度计算加权平均值是否意味着样本较多的类比样本较少的类加权更高,或者,似乎更符合逻辑的是,较小的类比较大的类加权更多 我在docu中找不到任何东西,我想确保我选择了正确的度量 谢谢 简短回答:按支持权重表示支持越高,权重越高。这意

我正在处理一个不平衡的数据集,并尝试使用验证度量来处理它。 在scikit docu中,我发现了以下加权平均值:

计算每个标签的指标,并找到其加权平均值 支持每个标签的真实实例数。这改变了 “宏观”来解释标签不平衡;这可能会导致F分数 这不是在精确性和召回率之间

通过支持度计算加权平均值是否意味着样本较多的类比样本较少的类加权更高,或者,似乎更符合逻辑的是,较小的类比较大的类加权更多

我在docu中找不到任何东西,我想确保我选择了正确的度量


谢谢

简短回答:按支持权重表示支持越高,权重越高。这意味着某个类的样本越多,其加权分数就越高

也就是说,请注意,您并没有通过为度量选择另一种计算方法来处理阶级不平衡问题。我相信他们是为了给你提供另一个视角的模式的表现


通常,模型在大多数类上的性能要好得多。使用加权指标会过分强调这一点。但该模型在少数族裔群体中仍有相同的,可能相当差的表现。如果它们碰巧是重要的,你可能会自欺欺人

感谢您的澄清和补充信息!这对我了解全局有很大帮助。不用担心。如果你认为答案很好地回答了你的问题,那么不妨考虑一下投票。