Advertisement

卷积神经网络——目标检测.目标定位

阅读量:

在计算机视觉领域中,目标检测是一项备受关注的重要方向。通过结合图像处理模式识别等相关领域的理论和技术实现,在这一过程中起着关键作用的基础环节是物体定位技术。可以说,在某种程度上讲,在这一过程中起着关键作用的基础环节是物体定位技术。其中,在这一环节上的精准度直接影响到后续步骤的成功与否。

图片分类问题已经不陌生了

在这里插入图片描述

如图所示,在卷积神经网络中馈入一张测试图片后模型会通过softmax神经元计算并给出预测图像类型的概率

首要任务是确定被检测对象边界框的相关参数(包括位置坐标和尺寸参数)。这些参数通常表示为(b_x,b_y,b_h,b_w)的形式,在计算机视觉中用于描述目标区域的位置与大小。
其中(bx,by)代表目标区域中心点的位置坐标;(bh,bw)则分别表示该区域的高度和宽度。
常规做法是以图片左上角作为坐标系的起点,在这种情况下右下角对应于坐标(1,1)这一特定设置。

在这里插入图片描述

当然,在实现(b_x, b_y, b_h, b_w)参数的输出目标时

在这里插入图片描述

Pc用于表示我们图中的目标是否归类于现有的person、car和motorcycle这三大类之一。这些参数(如b_x, b_y, b_h, b_w)通常用于描述目标框的坐标信息。其中C1对应person类别,C2对应car类别,C3对应motorcycle类别。

根据给定的任务要求和示例指导方针对文本进行改写

全部评论 (0)

还没有任何评论哟~