Machine learning 如果没有正面/负面含义,如何计算召回率和准确率?

Machine learning 如果没有正面/负面含义,如何计算召回率和准确率?,machine-learning,precision-recall,Machine Learning,Precision Recall,当类中没有正的、负的含义,但它们只是表示一些中性的东西时,如何计算这些度量 比如说,我们有一个分类问题,你有两个类代表一个人(John,Alex),你想把你的新实例分类为其中一个。我们的目标是找出这个新人是像约翰,还是像亚历克斯。那么你如何计算召回率和准确率呢?通常在这种情况下,准确率是不存在的,你能做的(人们通常做的)是报告两个准确率,在你的情况下: 识别约翰的准确度 Alex的识别精度 换句话说,您只需将每个类分别视为正类,并报告多个精度。有些度量没有这个问题(比如准确性),因为它们是对

当类中没有正的、负的含义,但它们只是表示一些中性的东西时,如何计算这些度量


比如说,我们有一个分类问题,你有两个类代表一个人(John,Alex),你想把你的新实例分类为其中一个。我们的目标是找出这个新人是像约翰,还是像亚历克斯。那么你如何计算召回率和准确率呢?

通常在这种情况下,准确率是不存在的,你能做的(人们通常做的)是报告两个准确率,在你的情况下:

  • 识别约翰的准确度
  • Alex的识别精度
换句话说,您只需将每个类分别视为正类,并报告多个精度。有些度量没有这个问题(比如准确性),因为它们是对称的。对于非等轴测(如精度或F1),您必须执行以下三项操作之一:

  • 决定哪一类是积极的
  • 报告多个值,每个值具有定义为“正值”的不同类别
  • 汇总上述结果-例如,通过报告类别平均精度、中值精度等
最后一句话——不存在“一般做法”,因为每种方法都会回答不同的问题。一旦您能够严格定义模型试图回答的问题,您就可以选择最佳度量


例如,如果您的问题是“我想最大限度地提高以前从未见过的对象x的正确分类概率,该对象x是从与我的训练集相同的数据源中采样的”,则答案是准确度,而不是准确度或召回率。

Jhon为1级,Alex为2级。如果您只有两个类,您仍然可以将它们表示为正数和负数,如果没有,您将看到“多类度量”: