AAAI 2020 Oral | 华科提出TANet:提升点云3D目标检测的稳健性

点击我爱计算机视觉标星,更快获取CVML新技术


本文转自机器之心。

机器之心发布

机器之心编辑部

2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。不久之前,大会官方公布了今年的论文收录信息:收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。

本文对AAAI Oral 论文《TANet: Robust 3D Object Detection from Point Clouds with Triple Attention》进行了详细解读。该研究提出了新型三元注意力模块和 Coarse-to-Fine Regression,实现了检测性能和稳健性的提升。

论文链接:https://arxiv.org/abs/1912.05163

代码链接:https://github.com/happinesslz/TANet(即将开源)

华中科技大学和中科院自动化所的研究者近期合作了一篇论文,探讨了点云 3D 目标检测的稳健性,这在现有方法中很少提及。该研究发现两个重要现象:1)难以检测的对象(如行人)的检测准确率不够好;2)添加额外的噪声点后,现有方法的性能迅速下降。

为了缓解这些问题,该研究提出新方法 TANet,它主要包含三元注意力(Triple Attention,TA)模块和 Coarse-to-Fine Regression (CFR) 模块。TA 模块联合考虑通道注意力、点注意力和体素注意力,从而增强目标的关键信息,同时抑制不稳定的点。此外,新型堆叠 TA 模块还可以进一步利用多级特征注意力。而 CFR 模块可在不过度消耗计算成本的情况下提升定位准确率。

在 KITTI 数据集验证集上的实验结果表明,在难度较大的噪声环境中(即在每个对象周围添加额外的随机噪声点),TANet 的性能远远超过当前最优方法。此外,在 KITTI 基准数据集上执行 3D 目标检测任务后发现,TANet 仅使用点云作为输入,即在「行人」(Pedestrian)类别检测中取得 SOTA 的成绩。其运行速度约为每秒 29 帧。

3D 目标检测有多难?

点云 3D 目标检测有大量现实应用场景,尤其是自动驾驶和增强现实。一方面,点云提供可靠的几何结构信息和精确深度,那么如何高效利用这些信息就是一个重要问题。另一方面,点云通常是无序、稀疏、不均匀分布的,这对于准确目标检测是一项巨大挑战。

近年来,3D 目标检测社区提出了多种基于点云的方法。PointRCNN 直接基于原始点云运行,用 PointNet 提取特征,然后用两阶段检测网络估计最终结果。VoxelNet、SECOND 和 PointPillars 将点云转换成规则的体素网格,然后应用一系列卷积操作进行 3D 目标检测。

尽管现有方法实现了不错的检测准确率,但在难度较高的情形下这些方法仍然无法获得令人满意的性能,尤其是对于难以检测的对象,如行人。

如下图 1 所示,PointPillars 漏掉了一个行人,还对一个对象的预测为假正例。研究者从两个方面揭示了预测错误的本质原因:1)行人的体积小于汽车,因此激光雷达扫描到的有效点较少。2)行人频繁出现在大量场景中,因此多种多样的背景物体(如树、灌木丛、电线杆等)可能与行人很接近,这给准确识别行人带来极大难度。因而,在复杂点云中执行目标检测仍然是一项极有难度的任务。

图 1:行人检测结果。第一行展示了对应的 2D 图像,第二行分别展示了 PointPillars 和 TANet 的 3D 检测结果。红色箭头标示出 PointPillars 漏掉和错误的检测对象。

该研究提出的新方法——TANet

这篇论文提出了一种新型架构——Triple Attention Network (TANet),如图 2 所示。它主要包含三元注意力(Triple Attention,TA)模块和 Coarse-to-Fine Regression (CFR) 模块。该方法的直接动力是,在严重噪声环境下,一组包含有用信息的点可为后续的回归提供足够的线索。为了捕捉到这类包含有用信息的线索,TA 模块增强判别点,并抑制不稳定的点。具体来说,TA 模块分别学习点注意力和通道注意力,然后利用元素相乘将它们结合起来。此外,研究者还考虑体素注意力,即体素的全局注意力。

图 2:TANet 的整体流程图。首先,将点云均匀分割成包含一组体素的体素网格。然后用堆叠 TA 模块分别处理每个体素,获得更具判别性的表示。之后,用最大池化方法聚集每个体素内的点,从而为每个体素提取紧凑的特征表示。研究者根据体素在网格中的原始空间位置排列体素特征,从而得到体素网格的特征表示 C' × H × W。最后,使用 CFR 模块生成最终的 3D 边界框。

在噪声环境下,仅应用单个回归器模块(如一阶 RPN)做 3D 边界框定位的效果不尽如人意。为了解决这一问题,该研究提出一种端到端可训练的 coarse-to-fine regression (CFR) 机制。其中,粗糙步按照 (Zhou and Tuzel 2018; Lang et al. 2019) 的方法对对象进行粗略估计。然后,利用新型 Pyramid Sampling Aggregation (PSA) 融合方法得到跨层特征图。细化基于融合后的跨层特征图实现,从而得到更精细的估计结果。

TA 模块和 CFR 机制对于 3D 检测器的稳健性都很关键,而 3D 检测器的稳健性对自动驾驶真实场景非常重要。由于 KITTI 数据集中并非所有数据都受噪声所扰,因此研究者在实验评估过程中,通过在每个对象周围添加随机噪声点来模拟噪声环境。大量实验证明,TANet 方法在 KITTI 基准 Pedestrian 类别检测中取得了最优的检测结果,这进一步证明了 TANet 检测器的稳健性。

TANet 的主要贡献

TANet 方法做出了以下重要贡献:

1. 提出新型 TA 模块,该模块联合考虑通道注意力、点注意力和体素注意力,并执行堆叠操作从而获得多级特征注意力,进而得到对象的判别表示;

2. 提出新型 coarse-to-fine regression 机制,基于粗糙回归结果,在包含有用信息的融合跨层特征图上执行细化回归(fine regression);

3. 该方法在难度较高的噪声环境中取得了不错的实验结果,在 KITTI 基准数据集上的量化比较结果表明,TANet 方法获得了当前最优性能,且其推断速度很快。

使用 TANet 执行 3D 目标检测

如图 2 所示,TANet 包含两个主要部分:堆叠 TA 模块和 CFR 模块。

堆叠 TA 模块

图 3:TA 模块架构图。

CFR 模块

研究者利用粗糙回归(Coarse Regression,CR)模块和细化回归(Fine Regression,FR)模块执行 3D 边界框估计。

图 4:CFR 架构图。金字塔采样(Pyramid Sampling)表示一系列下采样和上采样操作,它们通过池化和转置卷积来实现。

实验

在 KITTI 数据集上评估模型性能

  • 在噪声点云数据上的结果

下表 1 展示了 TANet 与当前最优方法在噪声环境下的定量结果。尽管 PointRCNN 检测 Cars 类别的 3D mAP 比 TANet 高出 0.43%,但在噪声环境下,TANet 方法展现出更强大的稳健性。在添加 100 个噪声点的情况下,TANet 获得了 79.34% 的 3D mAP,比 PointRCNN 高出 1.7%。对于 Pedestrians 类别,TANet 的性能分别比 PointPillars 和 PointRCNN 高出 5.8% 和 11.9%。从中我们可以看出,TANet 方法对噪声具备强大的稳健性,尤其是对难以检测的样本,如 Pedestrians、hard Cyclists 和 hard Cars。

表 1:在 KITTI 验证集上,TANet 和 PointRCNN、PointPillars 对 Cars、Pedestrians 和 Cyclists 类别的 3D 目标检测性能对比情况。3D mAP 表示每个类别的平均准确率。

  • 在原始点云数据上的结果

下表 2 展示了不同方法在 KITTI 官方测试数据集上的实验结果。TANet 对三个类别的 3D mAP 是 62%,比当前最优方法 PointPillars 和 PointRCNN 分别高出 1.20% 和 1.22%。尤其对于难以检测的对象(如行人),TANet 的性能比 PointPillars 和 PointRCNN 分别高出 2.30% 和 4.83%。

表 2:在 KITTI 测试数据集上,TANet 新方法和之前方法对 Cars、Pedestrians 和 Cyclists 类别的 3D 目标检测性能对比情况。3D mAP 表示模型对这三个类别的 3D 目标检测平均准确率。

下图 5 展示了模型学得特征图和模型预测置信度得分特征的可视化图。

图 5:模型学得特征图和模型预测置信度得分的可视化图示。

控制变量实验

表 3:对通道注意力、点注意力和体素注意力及其不同组合的效果进行控制变量实验。所有实验都在不使用 FR 模块的前提下实施。

表 4:对 PSA 模块的效果进行控制变量实验。


目标检测交流群

关注最新最前沿的2D、3D目标检测技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:目标检测)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

我爱计算机视觉
关注 关注
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TANet:AAAI-2020文件(口头)
03-08
TANet 我们的代码主要基于和 ,谢谢! 我们还计划引入TensorRT,以进一步提高推理速度。 有关更多信息,请参阅。新闻更新! 将TANet添加到最新的。 second.pytorch软件包中的TANet与pointpillars_with_TANet可以达到...
ForeSeE:用于3D对象检测的任务感知单眼深度估计,AAAI2020
05-29
用于 3D 对象检测的任务感知单目深度估计该项目托管用于实现 ForeSeE 算法进行深度估计的代码。 , 王新龙,尹茵,陶涛,姜玉宁,李磊,沉春华AAAI,2020年安装此实现基于 。 安装请参考 。数据集详情请参考。 提供...
【论文阅读】【3d目标检测TANet: Robust 3D Object Detection from Point Clouds with Triple Attention
hgj1h的博客
05-03 935
论文题目:TANet: Robust 3D Object Detection from Point Clouds with Triple Attention 代码开源出来的 可以放心使用! 文章在kitti上做的实验,发现对于小目标的检测效果很好 作者也做了一些噪声的实验 主要是在物体上加噪声,以此来证明网络的鲁棒。这是文章的两个出发点。 这是怎么做的呢? 主要是作者认为考虑点级别、channel级别和voxel级别的检测器,对于小物体的效果是好的。因为这些小物体本身上面的点就很小,如果和大物体例如车
3D 目标检测 - PointPillars(CVPR 2019)
77wpa的博客
03-08 1万+
3D 目标检测 - PointPillars1. 文章信息2. PointPillars 简介2.1 算法特点2.2 模型结构2.2.1 Pillar Feature Net2.2.2 Backbone (2D CNN)2.2.3 Detection Head (SSD) 1. 文章信息 文章标题 PointPillars: Fast Encoders for Object Detection from Point Clouds (2019) 文章链接 https://arxiv.org/ab
基于3D点的小目标检测学习笔记
sinounuo的博客
03-16 2504
3D点检测学习笔记(仅为内容整理,有些东西比较省略,我放了原作者连接)
3D点检测神技 | UFO来了!让PointPillars、PV-RCNN统统涨点!
最新发布
CV_Autobot的博客
01-16 317
作者|AI驾驶员 编辑| 智驾实验室点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【3D目标检测】技术交流群本文只做学术分享,如有侵权,联系删文在这篇论文中提出了一个关于在3D点中检测未知前景物体(UFO)的新问题,这是自动驾驶在野外中的一个关键技术。UFO检测具有挑战,因为现有的3D目标检测器在3D定位和Out-of-Distribution...
ACT_AAAI20:AAAI 2020论文“ ACT”的代码
05-04
用于非监督跨域人员重新识别的非对称协同教学(AAAI 2020) AAAI 2020纸用于代码。要求的Python 3.7 带4个GPU的服务器Market1501,DukeMTMC-reID和其他数据集。 在列出的其他必需的包适应ACT 按照“ data / readme...
SemBERT:用于语言理解的语义感知BERT(AAAI 2020)
04-24
SemBERT:用于语言理解的语义感知BERT (2020/10/07)更新:可能出现问题的提示 SRL预测与提供的样本不匹配 使用不同的spaCy版本时,POS标签... AAAI 2020中代码 概述 要求 (我们的实验环境可供参考) Python 3.6+ P
OIM:用于弱监督对象检测的对象实例挖掘(AAAI 2020)
03-09
该论文已被AAAI 2020接受。有关更多详细信息,请参阅我们的。 入门 要求 Caffe和pycaffe要求(请参阅: ) 注意: Caffe必须在支持Python层的情况下构建! # In your Makefile.config, make sure to have this ...
入门激光雷达点的3D目标检测
pytorch内部机制解读
05-16 7936
前言 虽然业界有很多的争论,但是LiDAR在目前的L3/L4级自动驾驶系统中依然是不可或缺的传感器,因为它可以提供稠密的3D点,非常精确的测量物体在3D空间中的位置和形状,而这是摄像头和毫米波雷达很难做到的。那么相应的,基于LiDAR点的感知算法也就成为了近年来自动驾驶研发的重点之一。与图像的感知算法类似,LiDAR点的感知算法也分为物体检测(包括跟踪)和语义分割两大类。这篇文章主要关注基于LiDAR点的物体检测算法,语义分割算法留待以后再做介绍。 很多综述的文章把LiDAR点的物体检测算法粗略
万字长文详解目标检测算法,超大超全(2022最新)
热门推荐
qq_40716944的博客
09-16 1万+
基于深度神经网络的目标检测器不断发展,并用于多种应用,每个应用都有自己的一组要求。安全关键型的应用程序需要高精度和可靠,而低延迟的任务需要节约资源的神经网络结构。实时目标检测器在有高影响力的现实世界应用中是必不可少的,并不断有新方法提出,但它们过分强调精度和速度上的改进,而忽略了其他方面,如多功能、鲁棒、资源和能源效率。现有网络的参考基准不存在,新网络设计的标准评估指南也不存在,这导致比较模棱两可和不一致。
AAAI 2019 Oral | 让TA说你想听的—基于音/视频特征解离的讲述者人脸生成
Paper weekly
01-28 1010
你是否希望照片上的偶像、男神女神,甚至动画人物对着你说出你想听的那句话?又或是希望伪造明星说他们没说过话的视频?作者丨Lovely Zeng学校丨CUHK研究方向丨Det...
AAAI Oral】阿里提出新神经网络算法,压缩掉最后一个比特
weixin_40581617的博客
01-19 660
近年来,深度学习在人工智能领域取得了重大的突破。在计算机视觉、语音识别等诸多领域,深度神经网络(DNN, Deep Neural Network)均被证明是一种极具成效的问题解决方式。如卷积神经网络(CNN, Convolutional neural network)在计算机视觉诸多传统问题(分类、检测、分割)都超越了传统方法,循环神经网络(RNN, Recurrent Neural Netw
3D 目标检测 - CenterPoint:Center-based 3D Object Detection and Tracking(CVPR 2021)
77wpa的博客
03-08 4890
三维目标通常表示为点中的三维长方体。这种表示模拟了经过充分研究的基于图像的2D边界框检测,但存在额外的挑战。三维世界中的目标不遵循任何特定的方向,基于框的检测器很难枚举所有方向或将轴对齐的边界框拟合到旋转的目标。在本文中,我们建议将3D目标表示、检测和跟踪为点。我们的框架CenterPoint首先使用关键点检测器检测目标的中心,然后回归到其他属,包括3D大小、3D方向和速度。在第二阶段,它使用目标上的其他点特征来细化这些估计。在CenterPoint中,3D目标跟踪简化为贪婪的最近点匹配。
3D 目标检测 - VoxelNet(CVPR 2018)
77wpa的博客
12-17 2800
精确检测3D点中的物体是许多应用中的中心问题,例如自主导航、家政机器人和增强/虚拟现实。为了将高度稀疏的LiDAR点与区域提案网络(RPN)连接起来,大多数现有工作都集中在手工制作的特征表示上,例如鸟瞰投影。在这项工作中,我们消除了对3D点的手动特征工程的需求,并提出了VoxelNet,这是一种通用的3D检测网络,它将特征提取和边界框预测统一到单个阶段、端到端可训练的深度网络中。
小白科研笔记:点目标检测相关文献速读-Part A
Niuip的博客
04-14 988
1. 前言
目标检测简要综述
麻花
05-26 1万+
转自:http://imbinwang.github.io/blog/object-detection-reviewBin WangAbout Archive目标检测简要综述 May 6, 2015 6 minute read 目标检测(Object Detection)是计算机视觉领域中一个基础的研究课题,主要包含两类不同的检测任务:目标实例检测(Instance Object Detec
【3D Object Classification and Detection】01. PointNet
keltloja的博客
03-01 543
PointNet: Deep learning on point sets for 3d classification and segmentation
aaai 2020 tutorial explainable ai:
01-07
AAAI 2020的教程“可解释人工智能”将重点介绍可解释人工智能的概念、方法和应用。可解释人工智能是指人工智能系统能够以一种可理解的方式解释其决策和行为的能力。该教程将涵盖可解释人工智能的基本原则和方法,...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 一文读懂YOLOv5 与 YOLOv4 40337
  • CVPR 2020 论文大盘点-超分辨率篇 23007
  • CVPR 2020 论文大盘点-语义分割篇 16338
  • 终于有人把YOLO讲明白了 14967
  • OpenCV手部关键点检测(手势识别)代码示例 13155

最新评论

  • ICRA 2024 | RoboDrive挑战赛研讨会,加入我们,探索自动驾驶的未来!

    huishuaixiong: 您好,请问RoboDrive挑战赛获胜队伍的方案代码如何获取呢?

  • DivideMix: Salesforce提出使用半监督学习大幅改进含噪声标签的学习

    诸神的黄昏op: 这篇文章的数据集可以提供吗

  • 天津大学推出大型无人机航拍车辆数据集DroneVehicle

    I will,: 请问是是旋转框的多模态数据集么

  • ICCV 2023 Oral | 突破性图像融合与分割研究:全时多模态基准与多交互特征学习...

    HNUer609: 您好,您知道这个文章提出的数据集可视化标签对应的像素值哪里可以找得到吗?

  • ICCV 2023 | NeRF 提点的 Magic Loss —— S3IM 随机结构相似性

    陈嘿萌: 通过S3IM就可以大幅度提升性能吗,这个就是在图像或者特征上随机选择多个patch块,然后再计算指标吗。

大家在看

  • 【超详细版】Pilot漏洞测试教学靶场(Pilot靶场)搭建与使用教程
  • 【C++】程序设计期末复习day02(连更)试卷解析+类和对象
  • windows/linux下JDK安装配置教程 419

最新文章

  • 京东健康·全球医疗AI创新大赛开启!32万奖金池等你来拿!
  • 智源和港中文联合提出首个多功能3D医学多模态大模型(文本、定位和分割任务)...
  • Gemini在大考终于赢了GPT-4o!Jeff Dean连续转发三次!Video-MME首个视频多模态基准来了!...
2024
06月 21篇
05月 28篇
04月 28篇
03月 31篇
02月 16篇
01月 27篇
2023年312篇
2022年338篇
2021年665篇
2020年843篇
2019年581篇
2018年131篇
2017年1篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

PHP网站源码玉林关键词按天扣费价格山南网站排名优化多少钱北京网站优化按天收费公司楚雄网站推广工具推荐扬州网站推广工具公司银川关键词排名包年推广推荐扬州seo优化价格自贡优化多少钱太原网站优化排名公司孝感seo公司黔南seo排名报价湖州网站建设哪家好德宏网站优化按天收费报价芜湖建网站推荐亳州网站优化按天计费多少钱惠州英文网站建设宝鸡网站推广方案推荐遵义关键词排名包年推广公司忻州网站建设设计哪家好临汾建网站报价铜川网站建设价格唐山网站推广宁德百度网站优化排名多少钱通辽网站排名优化报价长春网站建设哪家好鹤壁SEO按天收费推荐爱联seo优化价格坂田至尊标王价格定西百度seo价格昌都百搜标王歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化