精度召回曲线下的面积,单位为R或其他汇总数量

精度召回曲线下的面积,单位为R或其他汇总数量,r,auc,R,Auc,我计划使用精确回忆图(PR图)来比较模型。请参阅下面的附图(部分截图,抱歉!)。显然,我手头有真阳性、真阴性、假阳性和假阴性,我需要一个每个模型的单个汇总数量。以下是我的问题: PR曲线下的面积(AUC)是第一个数量,但我不知道如何计算R中的面积。我不想使用任何包,如ROCR,因为所有代码都是我自己编写的,我希望使用可用的数量编写我自己的代码。似乎有很多种方法--我希望知道哪种方法最容易实现 另一个量是F-测度:结合精确性和召回率的测度是精确性和召回率的调和平均值,即传统的F-测度或平衡的F-得

我计划使用精确回忆图(PR图)来比较模型。请参阅下面的附图(部分截图,抱歉!)。显然,我手头有真阳性、真阴性、假阳性和假阴性,我需要一个每个模型的单个汇总数量。以下是我的问题:

  • PR曲线下的面积(AUC)是第一个数量,但我不知道如何计算R中的面积。我不想使用任何包,如
    ROCR
    ,因为所有代码都是我自己编写的,我希望使用可用的数量编写我自己的代码。似乎有很多种方法--我希望知道哪种方法最容易实现

  • 另一个量是F-测度:结合精确性和召回率的测度是精确性和召回率的调和平均值,即传统的F-测度或平衡的F-得分。然而,我很好奇,这是否比1中的AUC更好,或者他们描述了不同的事情?此外,由于我有一系列召回率和精度值,在这种情况下,我如何计算单个F度量值(参见下图)

  • 谢谢大家!


    要计算曲线的AUC,可以在caTools软件包中使用数值积分函数,如
    trapz()

    
    
    auc我会先看看已经为这些函数编写的代码。谢谢,但根据文档,“梯形规则不是计算积分的最精确方法(对于线性函数是精确的),例如辛普森规则(对于线性和二次函数是精确的)更精确。”当估计下面积的曲线在估计中使用的点之间是非线性的(即召回率和精确度的观察值)时,这是正确的。使用非参数方法估计AUC时(除非对曲线建模,否则就是这样),曲线在点之间是线性的。这使得梯形规则变得精确。然而,在实践中,当曲线表现良好时,两种方法之间几乎没有差异。