ap任务在哪里,ap任务

2022-08-07 10:34:25 热点扫描

　　概述上一章《机器学习回归模型评价指标-MAE, MSE, MAPE及代码实现》主要描述了Mae、MSE和mAPE的概念和代码实现。本章介绍了目标探测指示器AP和MAP。　　

　　AP图和AP图是图像分类任务中的评价方法。　　

　　AP和MAP的计算示例　　

　　首先由训练好的模型得到所有测试样本的置信度得分，并将每个类别(如汽车)的置信度得分保存在一个文件中(如comp1_cls_test_car.txt)。假设有20个测试样本，每个样本的id、置信度得分和基本事实标签如下：　　

　　接下来，对置信度进行排序，得到：　　

　　根据bbox和基础真值的预测iou来确定基础真值标签是正样本还是负样本。我们得到前5名的结果，前5名的样本具有最高的正面得分，预测标签为1，即：　　

　　在这个例子中，真阳性指的是第4和第2张图片，假阳性指的是第13、19和第6张图片。相对于盒子中的元素。在此示例中，置信度得分在前5名之外的元素是假阴性和真阴性，即：　　

　　其中，假底片(FN)是指第9、16、7、20张图片，真底片(TN)是指第1、18、5、15、10、17、12、14、8、11、3张图片。那么，在这个例子中，Precision=2/5=40%，也就是说对于汽车这个类别，我们选取了五个样本，其中两个是正确的，即准确率为40%；召回率=2/6=30%，也就是说在所有的测试样本中，总共有6辆车，但是因为我们只召回了2辆车，所以召回率是30% 　　

　　在实际的多类别分类任务中，我们通常不会满足只通过top-5来衡量一个模型好坏的要求，而是需要知道从top-1到top-N(N是所有测试样本的个数，本文为20)的精度和召回率。　　

　　假设这N个样本中有M个正例，那么我们会得到M个召回值(1/M，2/M，M/M)。对于每个召回值R，我们可以计算出对应于(r'=r)的最大精度，然后将这M个精度值进行平均，得到最终的AP值。计算方法如下：