Machine learning 严重不平衡数据的适当无偏度量

Machine learning 严重不平衡数据的适当无偏度量,machine-learning,classification,logistic-regression,imbalanced-data,Machine Learning,Classification,Logistic Regression,Imbalanced Data,在存在严重不平衡的数据和很少的正(少数)样本的情况下,我看到了关于二元分类的模型演化度量的相互冲突的选择。到目前为止,我在文献中看到了以下评分标准: 马修斯相关系数 f1\u加权或f1\u宏 实际或平均精度 平衡精度 G-均值 荆棘评分 我很想知道哪种方法是无偏的,更适合用于对高度不平衡的数据进行分类。如有任何推荐,将不胜感激!谢谢

在存在严重不平衡的数据和很少的正(少数)样本的情况下,我看到了关于二元分类的模型演化度量的相互冲突的选择。到目前为止,我在文献中看到了以下评分标准:

  • 马修斯相关系数
  • f1\u加权或f1\u宏
  • 实际或平均精度
  • 平衡精度
  • G-均值
  • 荆棘评分
  • 我很想知道哪种方法是无偏的,更适合用于对高度不平衡的数据进行分类。如有任何推荐,将不胜感激!谢谢