深度学习论文: CDNet: a real-time and robust crosswalk detection network on Jetson nano based on YOLOv5
深度学习论文: CDNet:基于YOLOv5算法的实时性与鲁棒性并存的交通信号灯检测网络部署在Jetson Nano上。
PDF: https://rdcu.be/cHuc8
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
1 概述
在YOLOv5网络中集成了一种名为squeeze-and-excitation(SE)的关注机制模块。通过采用负样本训练(NST)的方法来提升模型性能,并结合感兴趣区域(ROI)算法来优化检测速度。开发了一种名为滑动感受野短时向量记忆(SSVM)的新算法来提升车辆交叉行为的检测精度。通过引入合成雾增强技术使模型能够更好地适应有雾环境。在 Jetson nano 系列设备上实现了高达33.1帧每秒(FPS)的高效检测速度,在复杂的测试场景中取得了94.83%的平均F1分数。对于晴朗和多云等更适合的天气状况,在这些条件下F1分数达到了或超过了98%
2 CDNet

2-1 SENet (Squeeze-and-Excitation Network)
+注意力机制网络改进网络,提升精度,略微降低速度

2-2 negative samples training (NST)
+负样本训练,提升精度,速度不变

2-3 region of interest (ROI)
+感兴趣区域,提升速度,精度下降

2-4 Short-term Vectors Memory (SSVM)
+基于滑动感受野的短时向量记忆算法,在迁移斑马线检测任务至汽车过线行为检测任务的过程中,提高检测精度的同时保持速度不变。

2-5 Synthetic Fog Augment (SFA)
+合成雾增强算法,增强数据集,适应雾天,提升精度,速度不变

3 Experiments
CDNet最终在Jetson nano上完成了高达33.1FPS的实时目标检测任务,在多种天气条件下(包括多云、晴天、雨天、雾天以及夜间)实现了平均F1分数高达94.72%。与原生YOLOv5相比,在Jetson nano平台上使用640像素分辨率时,CDNet的检测性能提升了5.13%的F1分数并获得了显著的帧率提升至10.7FPS;而当分辨率降至288像素时,则进一步提升了F1分数至13.38%,同时帧率达到了令人满意的水平——从之前的数值跃升到新的高度——达到了令人满意的水平——这一提升幅度也相当可观。

