用于参考的———目标检测评价指标(AP:PR曲线下面积,mAP:多个类别的AP的平均值,IoU)

31 篇文章 2 订阅
订阅专栏

在这里插入图片描述

目标检测 — 评价指标

  评价指标:

  准确率 (Accuracy),混淆矩阵 (Confusion Matrix),精确率(Precision),召回率(Recall),平均正确率(AP),mean Average Precision(mAP),交除并(IoU),ROC + AUC,非极大值抑制(NMS)。

1、准确率 (Accuracy)

  分对的样本数除以所有的样本数 ,即:准确(分类)率 = 正确预测的正反例数 / 总数。

  准确率一般用来评估模型的全局准确程度,不能包含太多信息,无法全面评价一个模型性能。

2、混淆矩阵 (Confusion Matrix)

  混淆矩阵中的横轴是模型预测的类别数量统计,纵轴是数据真实标签的数量统计。

  对角线表示模型预测和数据标签一致的数目,所以对角线之和除以测试集总数就是准确率。对角线上数字越大越好,在可视化结果中颜色越深,说明模型在该类的预测准确率越高。如果按行来看,每行不在对角线位置的就是错误预测的类别。总的来说,我们希望对角线越高越好,非对角线越低越好。

3、精确率(Precision)与召回率(Recall)

  

  一些相关的定义。假设现在有这样一个测试集,测试集中的图片只由大雁和飞机两种图片组成,假设你的分类系统最终的目的是:能取出测试集中所有飞机的图片,而不是大雁的图片。

  • True positives : 正样本被正确识别为正样本,飞机的图片被正确的识别成了飞机。 
  • True negatives: 负样本被正确识别为负样本,大雁的图片没有被识别出来,系统正确地认为它们是大雁。 
  • False positives: 假的正样本,即负样本被错误识别为正样本,大雁的图片被错误地识别成了飞机。 
  • False negatives: 假的负样本,即正样本被错误识别为负样本,飞机的图片没有被识别出来,系统错误地认为它们是大雁。

  Precision其实就是在识别出来的图片中,True positives所占的比率。也就是本假设中,所有被识别出来的飞机中,真正的飞机所占的比例。

  

  Recall 是测试集中所有正样本样例中,被正确识别为正样本的比例。也就是本假设中,被正确识别出来的飞机个数与测试集中所有真实飞机的个数的比值。

  

  Precision-recall 曲线:改变识别阈值,使得系统依次能够识别前K张图片,阈值的变化同时会导致Precision与Recall值发生变化,从而得到曲线。

  如果一个分类器的性能比较好,那么它应该有如下的表现:在Recall值增长的同时,Precision的值保持在一个很高的水平。而性能比较差的分类器可能会损失很多Precision值才能换来Recall值的提高。通常情况下,文章中都会使用Precision-recall曲线,来显示出分类器在Precision与Recall之间的权衡。

4、平均精度(Average-Precision,AP)与 mean Average Precision(mAP)

  AP就是Precision-recall 曲线下面的面积,通常来说一个越好的分类器,AP值越高。

  mAP是多个类别AP的平均值。这个mean的意思是对每个类的AP再求平均,得到的就是mAP的值,mAP的大小一定在[0,1]区间,越大越好。该指标是目标检测算法中最重要的一个。

  在正样本非常少的情况下,PR表现的效果会更好。

  

5、IoU

  IoU这一值,可以理解为系统预测出来的框与原来图片中标记的框的重合程度。 计算方法即检测结果Detection Result与 Ground Truth 的交集比上它们的并集,即为检测的准确率。

  IOU正是表达这种bounding box和groundtruth的差异的指标:

  

6、ROC(Receiver Operating Characteristic)曲线与AUC(Area Under Curve)

     

  ROC曲线:

  • 横坐标:假正率(False positive rate, FPR),FPR = FP / [ FP + TN] ,代表所有负样本中错误预测为正样本的概率,假警报率;
  • 纵坐标:真正率(True positive rate, TPR),TPR  = TP / [ TP + FN] ,代表所有正样本中预测正确的概率,命中率。

  对角线对应于随机猜测模型,而(0,1)对应于所有整理排在所有反例之前的理想模型。曲线越接近左上角,分类器的性能越好。

  ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。

  ROC曲线绘制:

  (1)根据每个测试样本属于正样本的概率值从大到小排序;

  (2)从高到低,依次将“Score”值作为阈值threshold,当测试样本属于正样本的概率大于或等于这个threshold时,我们认为它为正样本,否则为负样本;

  (3)每次选取一个不同的threshold,我们就可以得到一组FPR和TPR,即ROC曲线上的一点。 

   当我们将threshold设置为1和0时,分别可以得到ROC曲线上的(0,0)和(1,1)两个点。将这些(FPR,TPR)对连接起来,就得到了ROC曲线。当threshold取值越多,ROC曲线越平滑。

   AUC(Area Under Curve)即为ROC曲线下的面积。AUC越接近于1,分类器性能越好。

   物理意义:首先AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。当然,AUC值越大,当前的分类算法越有可能将正样本排在负样本前面,即能够更好的分类。

  计算公式:就是求曲线下矩形面积。

  

 7、PR曲线和ROC曲线比较

  ROC曲线特点:

  (1)优点:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。因为TPR聚焦于正例,FPR聚焦于与负例,使其成为一个比较均衡的评估方法。

      在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。

  (2)缺点:上文提到ROC曲线的优点是不会随着类别分布的改变而改变,但这在某种程度上也是其缺点。因为负例N增加了很多,而曲线却没变,这等于产生了大量FP。像信息检索中如果主要关心正例的预测准确性的话,这就不可接受了。在类别不平衡的背景下,负例的数目众多致使FPR的增长不明显,导致ROC曲线呈现一个过分乐观的效果估计。ROC曲线的横轴采用FPR,根据FPR ,当负例N的数量远超正例P时,FP的大幅增长只能换来FPR的微小改变。结果是虽然大量负例被错判成正例,在ROC曲线上却无法直观地看出来。(当然也可以只分析ROC曲线左边一小段)

  PR曲线:

  (1)PR曲线使用了Precision,因此PR曲线的两个指标都聚焦于正例类别不平衡问题中由于主要关心正例,所以在此情况下PR曲线被广泛认为优于ROC曲线。

  使用场景:

  1. ROC曲线由于兼顾正例与负例,所以适用于评估分类器的整体性能,相比而言PR曲线完全聚焦于正例。
  2. 如果有多份数据且存在不同的类别分布,比如信用卡欺诈问题中每个月正例和负例的比例可能都不相同,这时候如果只想单纯地比较分类器的性能且剔除类别分布改变的影响,则ROC曲线比较适合,因为类别分布改变可能使得PR曲线发生变化时好时坏,这种时候难以进行模型比较;反之,如果想测试不同类别分布下对分类器的性能的影响,则PR曲线比较适合。
  3. 如果想要评估在相同的类别分布下正例的预测情况,则宜选PR曲线。
  4. 类别不平衡问题中,ROC曲线通常会给出一个乐观的效果估计,所以大部分时候还是PR曲线更好。
  5. 最后可以根据具体的应用,在曲线上找到最优的点,得到相对应的precision,recall,f1 score等指标,去调整模型的阈值,从而得到一个符合具体应用的模型。

 8、非极大值抑制(NMS)

   Non-Maximum Suppression就是需要根据score矩阵和region的坐标信息,从中找到置信度比较高的bounding box。对于有重叠在一起的预测框,只保留得分最高的那个。

  (1)NMS计算出每一个bounding box的面积,然后根据score进行排序,把score最大的bounding box作为队列中首个要比较的对象;

  (2)计算其余bounding box与当前最大score与box的IoU,去除IoU大于设定的阈值的bounding box,保留小的IoU得预测框;

  (3)然后重复上面的过程,直至候选bounding box为空。

  最终,检测了bounding box的过程中有两个阈值,一个就是IoU,另一个是在过程之后,从候选的bounding box中剔除score小于阈值的bounding box。需要注意的是:Non-Maximum Suppression一次处理一个类别,如果有N个类别,Non-Maximum Suppression就需要执行N次。

 

PR曲线、ROC曲线、AUC、AP简单梳理
weixin_42926836的博客
08-28 6652
是不是对一堆PR曲线、ROC曲线、AUC、AP傻傻分不清楚?是不是学完就忘忘了又学?希望这篇文章能帮你梳理清楚一坨乱麻。 1、混淆矩阵 每次在重温理解AUC、PR曲线、ROC曲线的时候,第一步就是在纸上画出来这个混淆矩阵,方便后序进阶。 预测/真实 1(Postive) 0(Negative) 1 (Postive) TP(True Postive:真阳) FP (False Postive:假阳) 0 (Negative FN (False Negative:假阴) TN (True
目标检测评估指标(apmapPR曲线
weixin_38208912的博客
01-04 3610
目标检测评估指标 1.对于目标检任务,分为单类别和多类别类别 AP:(average pression) 多类别 mAP:(mean average precision) 2.计算AP 已知:图片上有N个groundtruth,M个预测的bounding box,以及每个预测目标的confidence step1: 先将bounding box 按照 confidence排序 ste...
ROC曲线以及PR曲线的原理以及python实现
qq_60880381的博客
10-13 1108
我们简单的把图分为T1-T4四个部分,我们可以很明显的看出,T1部分应该是正确的,却被预测为错误的,这部分我们把它记录为FP(false positive),T2部分是正确的,预测也是正确的,这部分我们把它记录为TP(true positive),T3部分是错误的,却被预测为正确的,这部分我们把它记录为FN(false negative),T4部分是错误的,预测也是错误的,这部分我们把它记录为TN(true negative)。PR曲线的横轴为召回率,从0到1逐渐增加,纵轴为精确率,从0到1逐渐增加。
PR曲线和ROC曲线理解2---进阶理解
qm5132的博客
09-29 2288
前段时间写了ROC曲线PR曲线的思想,这次做一些延伸: PR曲线计算范围:大于阀值的那些样本计算得到。 而ROC曲线计算范围:根据阀值点对全量样本判断,进而依据全量样本计算。 1、什么是BEP(best event point),怎么选择 BEP是PR曲线中P=R时对应的阀值点,即在哪一个阀值下,精确率p和召回率r会相等。结合pr曲线趋势理解,bep越大,说明pr曲线越靠近右上角,...
PR曲线Precision-Recall Curve,精确率-召回率曲线
weixin_44012667的博客
06-26 1100
PR曲线Precision-Recall Curve,精确率-召回率曲线)是一种用于评估二分类模型性能的工具,特别适用于不平衡数据集。PR曲线通过绘制精确率(Precision)与召回率(Recall)之间的关系,展示模型在不同决策阈值下的表现。
PR曲线
qq_39114535的博客
03-19 3331
指标 Precision查准率。 Recall查全率。​​​ mAPIOU以及置信度阈值关系 TP: IoU>0.5的检测框数量(同一Ground Truth只计算一次) FP: IoU<=0.5的检测框,或者是检测到同一个GT的多余检测框的数量 增加置信度阈值,我们会对预测值更有信心,即增加了查准率。但这样会降低查全率。(High Precision, Low Recall) 减小置信度阈值,则模型放过的真例就变少,查全率就增加。(Low Precision, High Recall) 进而
机器学习基于Python实现PR曲线和ROC曲线
m0_62682527的博客
10-21 2485
PR曲线和ROC曲线是评估分类模型性能的重要工具。它们可以帮助我们在不同阈值下比较模型的性能,并选择最佳的阈值进行预测。这篇博客将介绍如何使用Python实现PR曲线和ROC曲线,并提供相应的示例代码。在介绍PR曲线之前,我们需要先了解几个概念。这里为了更加形象深刻地理解我们采用识别汉堡🍔的样例。为了判断一张图片是不是汉堡我们可以把照片扔进去一个分类器进行识别如下:其中根据上面数据得到的预测和实际结果的对比我们做出了以下表格:上面表格中的四个数组成的矩阵也就是我们需要理解的的混淆矩阵。
python画yolo目标检测的loss曲线mAP曲线等.zip
08-12
mAP曲线展示了不同IoU(Intersection over Union,重叠度)阈值下的平均精度,帮助我们了解模型在各种程度的定位精度下表现如何。 在Python中,可以使用matplotlib库来绘制这些曲线。首先,你需要收集训练过程中的...
python:目标检测模型预测准确度计算方式(基于IoU)
09-18
IoU是衡量两个边界框重叠程度的标准度量,常用于评估目标检测任务中的检测效果。具体而言,它是预测边界框(DetectionResult)与实际边界框(GroundTruth)交集面积与它们并集面积的比率。IoU的计算公式如下: \[ ...
YOLOv6:专用于工业应用的单级目标检测框架完整版.rar
03-03
在实际应用中,YOLOv6可能需要针对特定的工业环境进行定制,包括针对特定目标类别的训练、调整模型参数以适应不同的硬件资源,以及集成到现有的自动化系统中。此外,为了保证模型的稳定性和鲁棒性,还需要进行大量的...
目标检测mAP计算代码
11-24
AP计算的是这个曲线下的面积。 **mAP(Mean Average Precision)**: mAP是所有类别的平均精度的平均值,考虑了多类别的情况。在PASCAL VOC数据集中,mAP是对每个类别计算的AP取平均,得到的是算法对所有类别的总体...
目标检测数据:光伏电池缺陷检测(xml标注文件)
03-25
在这个案例中,XML文件会详细描述图像中每个目标的边界框坐标,以及对应的目标类别。边界框是围绕目标对象的矩形,坐标通常由左上角和右下角的像素位置定义。类别信息则指示出检测到的是“损坏”还是“无效”的目标...
指标评估 —— AP & mAP 详细解读
DAOCHI
02-06 6540
文章目录: 问题背景; 相关概念; 两个阈值; 非极大值抑制; Precision x Recall Curve; Average Precision; 实例展示; 参考链接;
通俗地讲解目标检测AP指标
热门推荐
qq_19313495的博客
03-20 3万+
声明:以下内容全是我的个人见解,如有问题,欢迎指正!
【计算机视觉 | 目标检测】常见的两种评价指标AP50和APr的理解和对比
wzk4869的博客
04-01 8067
【计算机视觉 | 目标检测】常见的两种评价指标AP50和APr的理解和对比
目标检测模型常用评价指标-(APmAP
cxh21627的博客
08-05 2265
对于一个给定的类别,让我们对验证集中的每张图片都计算它的精确率。假设我们的验证集中有 100 张图片,并且我们知道每张图片都包含了所有的类别(单个图片的多分类问题)。全类平均正确率,又称全类平均精度, 所有类别AP值累加求和/类别数,是将所有类别检测的平均正确率(AP)进行综合加权平均而得到,在目标检测领域,是十分重要的衡量指标,用来衡量目标检测算法的性能;有了AP的概念,mAP/Mean Average Precision就很好理解了,还是借用上面20个分类的例子,20个分类的AP均值。...
深度学习中APmAP、recall、IoU、NMS的评价指标介绍
weixin_43869605的博客
09-15 7777
1、通过混淆矩阵实例给大家讲解各个指标: 混淆矩阵 预测 0 1 真实 0 TN FP 1 FN TP 真阳率:代表将真实正样本划分为正样本的概率 伪阳率:代表将真实负样本划分为正样本的概率 精确率:precision = TP / (TP + FP) 召回率:recall = TP / (TP + FN) 准确率:accuracy = (TP + TN) ...
PR曲线面积计算
liuxf1993的博客
07-17 6386
 参加携程一个数据竞赛,要按PR曲线面积进行评估,简单写了个评估模型的函数,其中的label参数是按照预测得分排序后的目标值(0,1)列表 def pr_area(label): '''PR曲线 r值在0.05-0.5之间的面积''' pr = list() pos = label.count(0) neg = label.count(1) tp = ...
node-v17.3.1-x64.msi
最新发布
08-19
node-v17.3.1-x64.msi
写文章

热门文章

  • ubuntu18.04安装虚拟显示器,不接显示器可远程桌面 10982
  • Yolo置信度 9786
  • 1080ti和2080ti对比深度学习使用 9297
  • 计算机视觉、机器视觉、数字图像处理、机器学习/深度学习+图像处理 四者的关系 8981
  • 用于参考的———目标检测评价指标(AP:PR曲线下面积,mAP:多个类别的AP的平均值,IoU) 8054

分类专栏

  • cuda
  • 算法笔记
  • 自动驾驶 9篇
  • pcl-learning
  • 三维点云处理技术和深度学习在点云处理中的应用
  • 点云 5篇
  • 技术积累 22篇
  • ocean
  • c++杜
  • ros2 1篇
  • c++学习积累 1篇
  • tensorRTcuda
  • 无人驾驶从入门到提高
  • opencv图像处理 2篇
  • 数据结构与算法c++
  • 点云课程学习笔记 1篇
  • yanzhen视频分析 11篇
  • 机器学习+数学 41篇
  • 模式识别课程 6篇
  • 学习工具及问题记录 180篇
  • 计算机视觉 49篇
  • 可以CD 6篇
  • 可以uda 38篇
  • 可以 47篇
  • 模型优化轻量化 7篇
  • 图像分类 5篇
  • 目标检测 31篇
  • 图像分割 1篇
  • 目标追踪 10篇
  • 图像描述 跨模态检索 1篇
  • 图像生成 12篇
  • 增强现实
  • 迁移学习-跨域自适应 7篇
  • 视觉几何属性任务SLAM

最新评论

  • python类的变量、属性、方法 还有 arg的使用*arg和 **arg

    爱吃饭爱睡觉: 代码弄黑色是怕别人看见吗

  • cuda和GPU驱动的关系

    2301_76677897: 比我之前看得很多文章都讲得清楚,太感谢了!

  • 相机标定精度研究

    lusteryu: 相机本身也会有问题, 比如lens不完美, sensor不平, lens成像面与sensor不平等等原因

  • 双系统如何远程切换设置

    坠金: 似乎是预设了开机是Ubuntu,然后使用ubuntu的命令行重启。那如果想预设开机是window,那怎么切换呢?

最新文章

  • h264解码
  • 单目3D和bev综述
  • bevfomer self-att to transformer to tensorrt
2024年6篇
2023年8篇
2022年13篇
2021年109篇
2020年329篇
2019年1篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码塘坑网页制作观澜百搜标王东莞网站制作设计龙华标王大鹏网站搜索优化南澳百姓网标王坪山网站优化软件西乡网站优化排名丹竹头网站排名优化南联seo网站推广龙岗网站优化按天收费坪地SEO按天计费光明百姓网标王推广横岗seo盐田网站改版宝安营销型网站建设平湖seo网站优化福田网站设计模板爱联品牌网站设计福永SEO按天计费光明品牌网站设计南联百度关键词包年推广沙井企业网站建设丹竹头企业网站设计荷坳seo网站优化坂田网站建设福永SEO按天计费南澳seo广州关键词排名西乡网站优化按天收费歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化