Advertisement

Computer Vision Tasks

阅读量:

Computer Vision Tasks:

图像分类、目标检测、语义分割、实例分割;

仅限于目标检测和实例分割这两种技术实现了对实例级别的识别工作,其本质即是对每一个独立的物体进行识别。其中,目标检测主要表现为在图像中标注边界框,而实例分割则通过精确的区域提取来实现对象的识别。

实例识别:就是把图片中的每一个物体都单独进行识别出来;

目标检测:是输入图像,输出每一个物体;(就是多个类别的多个框)

图像分割:

Semantic Segmentation语义分割:我为每一个像素进行分类,不考虑该像素所属的物体类别,专注于判断该像素所属的类别。不区分同一目标物体的不同像素部分,而实例分割则要求区分不同物体的像素。

(2)Instance Segmentation实例分割技术:旨在实现对同一类别中的不同实例的识别;(需要对同一类别中的不同物体的像素进行区分)

在无人驾驶中还有全景分割:要把它看到的所有像素都做实例分割;

下面几张图比较有说服力:

计算机视觉还有其他的解决问题:

除了图像检测、定位、目标检测、语义分割、实例分割之外还有关键点检测;

综上所述,该研究中不仅涵盖了目标检测领域内具有代表性的关键模型,还详细阐述了其演进历程,同时精选了若干具有重要参考价值的数据集作为支撑材料。

目标检测分为两个流派:

单阶段模型:不进行候选框的提取,我将整个图像直接输入到模型中,该模型将整个图像传递给算法处理,算法能够直接生成目标检测结果,这一过程实现了从输入到输出的一步完成。这种设计整体上形成一个端到端的统一处理流程,因此被归类为单阶段模型。

(2)两阶段模型:首先从图像中提取若干候选框,然后对这些候选框进行分类、鉴别和坐标调整,最终得到结果。这就是首先提取候选框,然后逐一进行鉴别,这就是两个阶段,因此称为两阶段模型。

两阶段检测通常能实现较高的准确性,但需要筛选大量候选框,因此虽然准确但耗时较长;相比之下,单阶段检测虽然速度更快,但准确率相对较低;值得注意的是,YOLO系列中的V5版本在速度和准确度(特别是小目标识别)方面已经达到了较高的水平。

全部评论 (0)

还没有任何评论哟~