Machine learning 计算精度和召回率

Machine learning 计算精度和召回率,machine-learning,precision-recall,Machine Learning,Precision Recall,在使用NB分类器的有监督机器学习算法中,我对如何计算精度和召回率感到困惑 比如说 1)我有两门课A,B 2)我有10000份文档,其中2000份用于培训样本集(A类=1000,B类=1000) 3)现在在上述训练样本集的基础上,使用NB分类器对其余8000个文档进行分类 4)现在,在对5000份文件进行分类后,将其归为A类,3000份文件归为B类 5)现在如何计算准确度和召回率 请帮帮我 谢谢您好,您必须将结果分为四组- 真正的A类(TA)-正确划分为A类 错误的A类(FA)-错误地划分为A类

在使用NB分类器的有监督机器学习算法中,我对如何计算精度和召回率感到困惑

比如说
1)我有两门课A,B
2)我有10000份文档,其中2000份用于培训样本集(A类=1000,B类=1000)
3)现在在上述训练样本集的基础上,使用NB分类器对其余8000个文档进行分类
4)现在,在对5000份文件进行分类后,将其归为A类,3000份文件归为B类
5)现在如何计算准确度和召回率

请帮帮我


谢谢

您好,您必须将结果分为四组-
真正的A类(TA)-正确划分为A类
错误的A类(FA)-错误地划分为A类
真正的B类(TB)-正确划分为B类
错误的B类(FB)-错误地划分为B类

精度=TA/(TA+FA)
召回=TA/(TA+FB)

您可能还需要精度和F测量:

准确度=(TA+TB)/(TA+TB+FA+FB)
f-measure=2*((精度*召回)/(精度+召回))

更多信息:

为了清楚起见,让我解释一下

假设视频中有9只狗和一些猫,图像处理算法告诉您场景中有7只狗,其中只有4只是狗(真阳性),而3只是猫(假阳性)

精确性告诉我们在分类为狗的物品中,有多少是真正的狗

因此精度=真阳性/(真阳性+假阳性)=4/(4+3)=4/7

虽然回忆告诉了狗的总数,但实际上有多少只狗是在哪里找到的

所以回忆=真阳性/总数=真阳性/(真阳性+假阴性)=4/9


在你的问题上 你必须找到A类和B类的精确性和召回率

甲级

真正数=(5000份A类文件中A类文件的数量)

假阳性=(5000份A类文件中B类文件的数量)

从上面你可以找到精确性

召回率=真阳性/(测试时使用的A类文件总数)


对B类重复上述操作,以确定其精确度和召回率。

Tom感谢您的回复。现在如何识别TA、FA、TB、FB?我是否必须手动检查所有分类文件,或者是否有某种方法?您可以分别为每个类运行测试,并计算正确分类和错误分类。例如,当您对标记为A的测试文档运行测试时,每个文档有两种可能的分类:如果分类为A,则将1添加到TA,如果分类为B,则将1添加到FB。与B类似:如果分类为A,则将1添加到FA,如果分类为B,则将1添加到TB。我希望你能理解。:-)当然,对于A类和B类,您不必将测试分为两次运行,您只需运行一次即可完成,但我认为这更容易理解。谢谢Tom,我明白你真的救了我一天这就是我所困惑的现在我明白了解决办法再次感谢汤姆我再次需要你的帮助我想知道如何计算两个以上班级的f-测度我很抱歉我花了这么长时间才回复。您需要计算宏F-measure。请看这篇文章:-汤姆