Machine learning 准确度和召回率何时成反比?

Machine learning 准确度和召回率何时成反比?,machine-learning,classification,data-mining,information-retrieval,Machine Learning,Classification,Data Mining,Information Retrieval,我正在阅读机器学习中的精确性和召回率 问题1:精确性和召回率何时成反比?也就是说,什么时候会出现这样的情况:你可以提高你的准确度,但代价是降低召回率,反之亦然?各国: 通常,精确性和召回率之间存在反比关系, 在可能以降低成本增加一个的情况下 其他的。脑外科手术提供了一个明显的权衡例子 然而,我已经看到研究实验结果,精确性和召回率同时增加(例如,当您使用不同或更多的功能时) 在什么情况下,反向关系成立 问题2:我熟悉两个领域的精确性和召回概念:信息检索(如“从1毫米页面的语料库中返回100个最相关

我正在阅读机器学习中的精确性和召回率

问题1:精确性和召回率何时成反比?也就是说,什么时候会出现这样的情况:你可以提高你的准确度,但代价是降低召回率,反之亦然?各国:

通常,精确性和召回率之间存在反比关系, 在可能以降低成本增加一个的情况下 其他的。脑外科手术提供了一个明显的权衡例子

然而,我已经看到研究实验结果,精确性和召回率同时增加(例如,当您使用不同或更多的功能时)

在什么情况下,反向关系成立


问题2:我熟悉两个领域的精确性和召回概念:信息检索(如“从1毫米页面的语料库中返回100个最相关的页面”)和二元分类(如“将这100名患者中的每一位分类为是否患有疾病”)。精度和召回率在这两个或其中一个字段中是反向相关的吗?

只有当系统中有一些参数时,反向关系才成立,您可以改变这些参数以获得更多/更少的结果。还有一个简单的关系:降低阈值以获得更多结果,其中一些是TPs和FPs。事实上,这并不总是意味着准确率或召回率会同时上升和下降——真正的关系可以使用。同样,对于Q2,在这两项任务中,精确性和召回率不一定是负相关的


那么,如何提高召回率或准确率,而不同时影响其他人呢?通常,通过改进算法或模型。也就是说,当你仅仅改变一个给定模型的参数时,逆关系通常成立,尽管你应该记住它通常也是非线性的。但是,例如,如果您向模型中添加更多描述性特征,您可以同时增加这两个指标。

关于第一个问题,我将这些概念解释为您的结果必须具有多大的限制性

如果你更严格,我的意思是,如果你对结果的正确性要求更高,你希望它更精确。因此,只要你得到的一切都是正确的,你可能愿意拒绝一些正确的结果。因此,您提高了精确度,降低了召回率。相反,如果你不介意得到一些不正确的结果,只要你得到了所有正确的结果,你就提高了回忆率,降低了精确度

关于与第二个问题有关的问题,如果我从上述各段的角度来看,我可以说是的,它们是反向相关的


据我所知,为了能够提高精确度和召回率,您需要更好的模型(更适合您的问题)或更好的数据(或者两者兼而有之)

维基百科的文章说,
通常情况下,存在一种相反的关系
。这意味着不总是
,只是经常
。您可能会将标题改为“精确性和回忆性何时成反比?”谢谢。我改了。非常感谢。您声明,如果可以限制返回的结果数量,则可能会出现反向关系。在Q2中,信息检索问题正好符合这一描述,但二元分类问题通常不符合,对吗?例如,对于任何给定的患者,您想要
疾病
无疾病
,或者对于任何给定的电子邮件,您想要
垃圾邮件
非垃圾邮件
。因此,对于某些分类任务,您将100%的测试数据进行分类,因此不存在反向关系。我说的对吗?不完全是限制,但根据某个阈值改变结果的数量——但基本上是对的。是的,关于你提到的二元分类问题,实际上,这里处理的是简单的准确度,也就是说,准确度和召回率是一样的。因为这两个指标的分母是相同的——要分类的案例总数。