Statistics ROC曲线数据点的计算(接收器-操作员特性)

Statistics ROC曲线数据点的计算(接收器-操作员特性),statistics,set,roc,Statistics,Set,Roc,给定一个特定的阈值e,我能够生成以下两组格式:- Set<String> observedDocs; Set<String> actualDocs; Set observedDocs; 设置实际接触点; 现在我必须计算出真阳性率和假阳性率。TPR很容易计算,它是召回的一个非常直观的定义,我采用以下方式:- private double recall(final Set<String> observedDocs, final Set<String>

给定一个特定的阈值e,我能够生成以下两组格式:-

Set<String> observedDocs;
Set<String> actualDocs;
Set observedDocs;
设置实际接触点;
现在我必须计算出真阳性率和假阳性率。TPR很容易计算,它是召回的一个非常直观的定义,我采用以下方式:-

private double recall(final Set<String> observedDocs, final Set<String> actualDocs) {
    Set<String> relevantAndRetrieved = new HashSet<>(observedDocs);
    relevantAndRetrieved.addAll(actualDocs);
    return relevantAndRetrieved.size() / actualLabels.size();
}
private双重召回(最终设定观察到的OCS,最终设定实际OCS){
Set relevantAndRetrieved=新哈希集(observedDocs);
相关和检索。添加所有(实际OCs);
返回relevantAndRetrieved.size()/actualLabels.size();
}

我需要一些基于等价集合操作的方法来计算假阳性率。我不想计算假阳性、假阴性计数等。

好吧,FPR是由分类器标记为阳性的否定示例的比例。但我不知道如何用变量来表达。您的
调用功能如何工作<代码>观察标签
实际标签
最多有2个元素,对吗?你的意思是把那些
列出来而不是
Set

抱歉,我指的是观察到的ocs和实际的ocs。我编辑了代码以反映这一点。