【论文阅读】【三维目标检测】Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection
文章目录
- MEGV
-
- DS Sampling
- Multi-group Head Network
- 效果
- Ablation Study
- 代码
Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection
出自旷视,nuScenes 3D Detection Challenge的冠军。
本文更多的数据增广,训练的tricks,不是在网络层面提出新的网络结构。
MEGV
本文的创新点在于:
- DS Sampling:使得类之间的数量更平衡,以对小样本的类的处理能力
- Multi-group Head Network:用文章中的原话,“our method performs better when training all categories jointly than training each of them individually”
总体结构如下:

DS Sampling
说实话,这块感觉讲的也不是很明白,主要是sample的定义没有说明白。
但从结果来看,对最后的效果确实有提升,但从图2中看,看起来并没有很有效果。
Multi-group Head Network
设置group的原因有两个:
- group内部的类别size和shape相似,可以互相促进,学到有用的信息
- group内部的类别较为均匀,排除大类别对小类别的压制作用。而且,经过group,car这个大类别对应的分类不再是truck这种小类别,而是(Truck, Construction Vehicle)的集合,从而进一步减轻大类别对小类别的压制作用。
效果
这里看到了一些之前没有遇到过的评价标准
-
mATE:Average Translation Error,the Euclidean center distance in 2D (units in meters)
-
mASE: Average Scale Error,the 3D intersection over union (IOU) after aligning
orientation and translation (1 − IOU),最终应该是(1 − IOU) -
mAOE:Average Orientation Error,the smallest yaw angle difference between prediction and ground truth (radians)
-
mAVE:Average Velocity Error,the absolute velocity error as the L2 norm of the velocity differences in 2D (m/s)
-
mAAE:Average Attribute Error,1 minus attribute classification accuracy (1 − acc).
-
NDS: nuScenes detection score (NDS),一个综合指标,综合上述所有的指标。
Ablation Study

这一块东西可以作为3D Object Detection 通用的ablation study手段进行使用。
文中没有提到的是:
- Res-Encoder:应该就是做成ResNet形式
- WS:TODO:目前还没有查到
- Hi-res:TODO:目前还没有查到
代码
代码:https://github.com/poodarchu/Det3D
该代码仓库集合个多个3D检测的代码。
