ap任务在哪里,ap任务

  

  概述上一章《机器学习回归模型评价指标-MAE, MSE, MAPE及代码实现》主要描述了Mae、MSE和mAPE的概念和代码实现。本章介绍了目标探测指示器AP和MAP。   

  

  AP图和AP图是图像分类任务中的评价方法。   

  

  AP和MAP的计算示例   

  

  首先由训练好的模型得到所有测试样本的置信度得分,并将每个类别(如汽车)的置信度得分保存在一个文件中(如comp1_cls_test_car.txt)。假设有20个测试样本,每个样本的id、置信度得分和基本事实标签如下:   

  

     

  

  接下来,对置信度进行排序,得到:   

  

     

  

  根据bbox和基础真值的预测iou来确定基础真值标签是正样本还是负样本。我们得到前5名的结果,前5名的样本具有最高的正面得分,预测标签为1,即:   

  

     

  

  在这个例子中,真阳性指的是第4和第2张图片,假阳性指的是第13、19和第6张图片。相对于盒子中的元素。在此示例中,置信度得分在前5名之外的元素是假阴性和真阴性,即:   

  

     

  

  其中,假底片(FN)是指第9、16、7、20张图片,真底片(TN)是指第1、18、5、15、10、17、12、14、8、11、3张图片。那么,在这个例子中,Precision=2/5=40%,也就是说对于汽车这个类别,我们选取了五个样本,其中两个是正确的,即准确率为40%;召回率=2/6=30%,也就是说在所有的测试样本中,总共有6辆车,但是因为我们只召回了2辆车,所以召回率是30%   

  

  在实际的多类别分类任务中,我们通常不会满足只通过top-5来衡量一个模型好坏的要求,而是需要知道从top-1到top-N(N是所有测试样本的个数,本文为20)的精度和召回率。   

  

  假设这N个样本中有M个正例,那么我们会得到M个召回值(1/M,2/M,M/M)。对于每个召回值R,我们可以计算出对应于(r'=r)的最大精度,然后将这M个精度值进行平均,得到最终的AP值。计算方法如下:   

  

     

  

  AP衡量模型在每个类别中是好是坏。计算每一类的AP,求和平均,就得到mAP。   

  

  在这种情况下,采用top-5评价,也可以采用其他评价,如AP50。即当预测框和真实框的IoU值大于这个阈值时,预测框被认为是真正,TP),反之则是假正(FP)。   

相关文章