Advertisement

【论文阅读】【三维目标检测】Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

阅读量:

文章目录

  • MEGV
    • DS Sampling
    • Multi-group Head Network
    • 效果
    • Ablation Study
    • 代码

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection
出自旷视,nuScenes 3D Detection Challenge的冠军。
本文更多的数据增广,训练的tricks,不是在网络层面提出新的网络结构。

MEGV

本文的创新点在于:

  • DS Sampling:使得类之间的数量更平衡,以对小样本的类的处理能力
  • Multi-group Head Network:用文章中的原话,“our method performs better when training all categories jointly than training each of them individually”

总体结构如下:
在这里插入图片描述

DS Sampling

说实话,这块感觉讲的也不是很明白,主要是sample的定义没有说明白。
但从结果来看,对最后的效果确实有提升,但从图2中看,看起来并没有很有效果。

Multi-group Head Network

设置group的原因有两个:

  • group内部的类别size和shape相似,可以互相促进,学到有用的信息
  • group内部的类别较为均匀,排除大类别对小类别的压制作用。而且,经过group,car这个大类别对应的分类不再是truck这种小类别,而是(Truck, Construction Vehicle)的集合,从而进一步减轻大类别对小类别的压制作用。

效果

这里看到了一些之前没有遇到过的评价标准

  • mATE:Average Translation Error,the Euclidean center distance in 2D (units in meters)

  • mASE: Average Scale Error,the 3D intersection over union (IOU) after aligning
    orientation and translation (1 − IOU),最终应该是(1 − IOU)

  • mAOE:Average Orientation Error,the smallest yaw angle difference between prediction and ground truth (radians)

  • mAVE:Average Velocity Error,the absolute velocity error as the L2 norm of the velocity differences in 2D (m/s)

  • mAAE:Average Attribute Error,1 minus attribute classification accuracy (1 − acc).

  • NDS: nuScenes detection score (NDS),一个综合指标,综合上述所有的指标。

Ablation Study

在这里插入图片描述
这一块东西可以作为3D Object Detection 通用的ablation study手段进行使用。
文中没有提到的是:

  • Res-Encoder:应该就是做成ResNet形式
  • WS:TODO:目前还没有查到
  • Hi-res:TODO:目前还没有查到

代码

代码:https://github.com/poodarchu/Det3D
该代码仓库集合个多个3D检测的代码。

全部评论 (0)

还没有任何评论哟~