yolov3识别的类别_车型识别相关技术

在交通安防领域中,车型识别被视为一个关键技术。它主要包含车辆检测、型号辨识以及色彩辨识三个环节。基于视频的技术实现中也包含了对追踪算法的构建。我们于19年开源了一套名为HyperVID的车型识别模型:
https://github.com/zeusees/HyperVIDgithub.com
在2020年7月时对该模型进行了更新升级,在当前的支持下,现支持国内超过4,000种车型及其对应年份。对于感兴趣的技术人员来说是个值得跟进的关注点。下面我们将其中涉及的技术进行拆解。
在2021年1月时对系统进行了功能优化,在当前的支持下可兼容超过5,863个型号的产品型号信息以及1,987个批次的批次号信息。对于技术有追求的用户来说是个值得关注的方向性探索方向。下面将对其中涉及的关键技术展开深入解析与实现细节探讨工作
1.数据
我们认识到该方法的主要优势在于其高度依赖于深度学习技术,并且为了有效训练模型, 我们需要构建高质量的数据集
BIT-Vehicle Dataset(目前网站已无法访问,请下载可以通过百度搜索获取下载链接)
2)MIT Cars Dataset(https://ai.stanford.edu/~jkrause/cars/car_dataset.html)
3)The CompCars dataset(CompCars Dataset)
仅依赖公开数据难以达到较高的准确率水平,在实际应用中存在诸多限制因素。一方面开源数据集的样本数量相对较少,在这种情况下模型的学习能力会受到限制;另一方面样本在不同角度和场景下的多样性不足也会对模型性能造成影响;此外训练过程中还可能面临计算资源紧张等问题。我们实习生团队也获取了一些公开数据,在线上的资源库中也同样能找到这些资料。
2.车辆检测
现有的多款高性能目标检测算法中包含SSD、YOLOv3、YOLOv4、CenterNet及RetinaNet等主流模型;其中针对单目标场景优化较多的是MTCNN及其改进版本RetinaFace;此外LFFD(YonghaoHe/A-Light-and-Fast-Face-Detector-for-Edge-Devices)也是一种适用于边缘设备的高效轻量级面部检测模型;在实际应用中发现YOLOv3在多物体探测任务中表现优异;而RetinaFace则更适合单物体探测场景;因此建议根据具体应用场景的需求进行选择与部署
3.跟踪
有很多跟踪算法存在。为了聚焦于在实际应用中表现优异且运行迅速的跟踪算法。我们选择了KCF和光流两种主要方法。不同类型的跟踪算法在性能上存在显著差异。经过测试和评估后发现,在GitHub平台上的joaofaro/KCFcpp项目实现了较高的效率。基于光流的方法大家都可以利用OpenCV来实现。
在这一实例中展示的是利用MobileNet-SGD结合KCF实现的检测与追踪技术案例。
4.车辆颜色识别
关于车辆外观颜色识别的技术方案中,公安部已有相关标准规定,并要求支持主流的9种颜色标准。目前市场上已有较多企业将颜色识别类别扩展至11种或13种等级别。在车辆颜色识别领域中我们采用了单独构建一个小网络来实现目标,在此方案下部分企业会采用多任务学习策略,在完成车辆种类识别的同时完成颜色识别功能。这种方式虽然在速度上相对较为高效但其升级过程较为繁琐需要分别开展多任务模型的训练工作并且每项多任务都需要独立进行繁重的网络训练过程由于市场上汽车颜色种类基本趋于稳定因此针对单一颜色识别问题只需开发一次即可满足后期应用需求对于颜色分类问题而言个人可以根据实际需求选择适合的小型神经网络模型进行开发其中ShuffleNet系列SqueezeNet以及MobileNet系列(如MobileNet v1.0)都是较为优秀的选择
5.车辆种类识别
车辆种类识别通常被视为一种细微粒度的任务(Fine-grained),也就是我们常说的细分类问题。目前已有大量研究致力于这一领域的探索与优化工作。值得注意的是,在工业界实现时往往与学术界有所不同,在实际应用中更注重效率与实用性的平衡。为了达到良好的识别效果,在包含5600种车型的数据集上进行训练与测试是必要的前提条件。为了提高模型性能,在设计主干网络时选择了移动版网路架构中的 Mobilenetv3-large,并在此基础上构建了完整的分类模型框架;通过实验发现,在测试集中实现了96%以上的Top-1准确率以及超过99.8%的Top-3准确率的优异表现;基于经验来看,默认采用ResNet-50架构已经能够满足实际应用需求;对于更大的模型规模则意义不大且可能带来性能瓶颈风险;总体而言,在保证准确率的同时权衡计算速度才是关键考量因素之一
6.后记
能观察到的是,在整个车辆识别系统的构建过程中
7.相关链接
1)在线体验:智云视图-专注移动端高效视觉算法研发
2)SqueezeNet:forresti/SqueezeNet
3)RetinaFace:https://github.com/biubug6/Pytorch_Retinaface
4)QQ群:737677707
