【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

阅读量：

You Only Look Once: Unified, Real-Time Object Detection

（一）论文地址：
- （二）核心思想：
- （三）网络结构：
- （四）Unified Detection：
- （五）实验细节：
- - 5.1 激活函数选择：
  - 5.2 坐标归一化处理：
  - 5.3 损失函数设计：
  - 5.4 训练参数设置：
- （六）实验结果：

（一）论文地址：

https://arxiv.org/pdf/1506.02640.pdf

（二）核心思想：

YOLO v1 的提出标志着 one-stage 方法的开创性发展，采用全局全连接方法，作者将目标检测问题重新定义为回归问题，每个预测框融合了全局信息，实现了端到端的高效训练。

此外，实验结果令人瞩目，不仅在速度上超越了R-CNN和DPM（达到45帧每秒），在精度方面也实现了显著提升。同时，采用更简洁的网络结构Fast YOLO，在保证精度的前提下，实现了155帧每秒的高效运行。

（三）网络结构：

YOLO的backbone仍然采用了分类网络，其后两层改用全卷积层，输出一个7×7×30的特征层，每个采样点均整合了全局特征信息。

（注意由于使用了全卷积，图像必须是统一448×448大小）

（四）Unified Detection：

这里是 YOLO 的点睛之笔；

YOLO旨在实现端到端（end-to-end）的训练，不再依赖anchor boxes或default boxes，而是直接将图像分割为 $S\timesS$ 个网格区域（文中 $S=7$ ）；

每个区域预测的值为：

该区域覆盖的相应物体的 $B$ 个坐标框的 $4$ 个值（文中 $B=2）$ ，分别为 $\lbrace x,y,w,h \rbrace$ ，同时输出这 $B$ 个预测框的置信度 $p_b$ ，选取置信度最高的那个预测框作为最终的结果；
该区域覆盖物体的分类置信度 $C$ ，其中在 VOC 数据集中 $C$ 是长度为 $20$ 的分类向量；

当且仅当物体的真值框中心位于相应的区域内时，该区域才能被标注为正样本，其置信度定义为：

即相应物体预测框与真值框的交并比（IOU）；

因此每个区域生成 $B\times(4+1)+C=30$ 个预测值，最后全连接层的输出大小为 $S\timesS\times30$ ；

通过 $B$ 个预测 box 生成置信度分数，旨在提高预测结果的容错性；虽然增大 $B$ 可以增强模型的鲁棒性，但同时会导致全连接层的计算复杂度显著提升。

（五）实验细节：

5.1 激活函数：

激活函数使用了 Leaky ReLU：

5.2 坐标归一化：

将预测的坐标值 $\lbrace x_p,y_p,w_p,h_p \rbrace$ 归一化为：

$x_p=(x-x_b)/L,y_p=(y-y_b)/L$

$w_p=w/W,h_p=h/W$

其中：

$x,y,w,h$ 代表真值框的坐标；
$x_b,y_b$ 表示对应区域的中心点坐标；
$W$ 被定义为图像的边长，具体数值为448；
$L$ 被定义为步长，其计算公式为 $W/S$ ；

5.3 Loss 函数：

Loss 函数使用了均方差损失函数；

同时为了调节正负样本不均衡问题，引入了两个权重参数：

$\lambda_{coord}=5$ ，具体体现正类样本的坐标回归权重参数； $\lambda_{noobj}=0.5$ ，具体体现负类样本的置信度权重参数。

负样本的预测坐标和类别向量不参与训练；

最终 Loss 定义如下：

5.4 训练细节：

$batch_size=64$

$momentum=0.9$

$weight$ $decay=0.0005$

$learning$ $rate$ 从 $10^{-3}$ 先升到 $10^{-2}$ 再降到 $10^{-4}$ ；

$drop$ $rate=0.5$

（六）实验结果：

（作者挑的图好奇怪，，，）

全部评论 (0)

还没有任何评论哟~

【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

YouOnlyLookOnce:Unified,RealTimeObjectDetection （一）论文地址：（二）核心思想：（三）网络结构：（四）UnifiedDetection：（五）实...

（YOLO v1）You Only Look Once: Unified, Real-Time Object Detection论文阅读笔记

文章目录（YOLO）YouOnlyLookOnce:Unified,RealTimeObjectDetection论文阅读笔记2016 Abstract 1\.Introduction 2\.Uni...

【论文阅读】You Only Look Once: Unified, Real-Time Object Detection

论文简介： YOLO是作者针对RCNN系列等的Twostage的目标检测算法的时间性能较低，训练、预测Pipeline分散复杂等的缺点，提出的一种更接近端到端的目标检测算法。其具有更加统一、清晰的结构...

阅读笔记：You Only Look Once: Unified, Real-Time Object Detection

阅读笔记：YouOnlyLookOnce:Unified,RealTimeObjectDetection 背景算法设计网络结构实验设计 \quad\quadYOLO算法（原文链接：<https:...

You Only Look Once: Unified, Real-Time Object Detection阅读笔记

疫情原因，学校新开设了一门文献阅读。唉，现在只好读一篇记录一点，最后还要写一万五千字的文献综述，绝望啊。今天的论文是：YouOnlyLookOnce:Unified,RealTimeObjectDe...

(YOLO)You Only Look Once: Unified, Real-Time Object Detection

论文地址：https://arxiv.org/abs/1506.02640 摘要我们提出了YOLO，一种新的物体检测方法。之前的物体检测工作是通过重新使用分类器来进行检测。相反，我们将对象检测抽象为...

YOLOv1(You Only Look Once: Unified, Real-Time Object Detection)论文笔记

论文链接：YouOnlyLookOnce:Unified,RealTimeObjectDetection 网页地址：YOLO 摘要：我们提出了YOLO，一个新的方法用于目标检测。之前的目标检测工作都...

You Only Look Once: Unified, Real-Time Object Detection 论文解读

本文章用以JMUAIA（集美大学人工智能协会）于2024/01/27发布在课堂派上的期末考核FINAL。论文来自于期末考核附件。论文中提到的YOLO项目网站一、 YOLO（YouOnlyLook...

You Only Look Once: Unified, Real-Time Object Detection

YouOnlyLookOnce:Unified,RealTimeObjectDetection 背景介绍在深度神经网络之前，早期的Objectdetection方法是通过提取图像的一些robust的...

You Only Look Once: Unified, Real-Time Object Detection

文章目录 Abstract 1\.Introduction 2\.UnifiedDetection 2.1.NetworkDesign 2.2.Training 2.3.Inference 2.4.L...

是否确定退出登录?

【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

You Only Look Once: Unified, Real-Time Object Detection

（一）论文地址：

（二）核心思想：

（三）网络结构：

（四）Unified Detection：

（五）实验细节：

5.1 激活函数：

5.2 坐标归一化：

5.3 Loss 函数：

5.4 训练细节：

（六）实验结果：

全部评论 (0)

相关文章推荐

【论文阅读笔记】YOLO v1——You Only Look Once: Unified, Real-Time Object Detection

（YOLO v1）You Only Look Once: Unified, Real-Time Object Detection论文阅读笔记

【论文阅读】You Only Look Once: Unified, Real-Time Object Detection

阅读笔记：You Only Look Once: Unified, Real-Time Object Detection

You Only Look Once: Unified, Real-Time Object Detection阅读笔记

(YOLO)You Only Look Once: Unified, Real-Time Object Detection

YOLOv1(You Only Look Once: Unified, Real-Time Object Detection)论文笔记

You Only Look Once: Unified, Real-Time Object Detection 论文解读

You Only Look Once: Unified, Real-Time Object Detection

You Only Look Once: Unified, Real-Time Object Detection