[深度学习论文笔记][Image Classification] Very Deep Convolutional Networks for Large-Scale Image Recognitio

阅读量：

Simonyan, Karen and Andrew Zisserman. "High-depth convolutional neural networks for large-scale image recognition." arXiv preprint arXiv:1409.1556 (2014). [Citations: 1986].

1 Motivation

Ways to Improve Accuracy

2 Architecture

[In a Nutshell (138M Parameters)]
• Input (3 × 224 × 224).
• conv1-1 (64@3 × 3, s1, p1), relu1-1.
• conv1-2 (64@3 × 3, s1, p1), relu1-2.
• pool1 (2 × 2, s2), output 64 × 112 × 112.
• conv2-1 (128@3 × 3, s1, p1), relu2-1.
• conv2-2 (128@3 × 3, s1, p1), relu2-2.
• pool2 (2 × 2, s2), output 128 × 56 × 56.
• conv3-1 (256@3 × 3, s1, p1), relu3-1.
• conv3-2 (256@3 × 3, s1, p1), relu3-2.
• conv3-3 (256@3 × 3, s1, p1), relu3-3.
• pool3 (2 × 2, s2), output 256 × 28 × 28.
• conv4-1 (512@3 × 3, s1, p1), relu4-1.
• conv4-2 (512@3 × 3, s1, p1), relu4-2.
• conv4-3 (512@3 × 3, s1, p1), relu4-3.
• pool4 (2 × 2, s2), output 512 × 14 × 14.
• conv5-1 (512@3 × 3, s1, p1), relu5-1.
• conv5-2 (512@3 × 3, s1, p1), relu5-2.
• conv5-3 (512@3 × 3, s1, p1), relu5-3.
• pool5 (2 × 2, s2), output 512 × 7 × 7 = 25088.
• fc6 (4096), relu6, drop6.
• fc7 (4096), relu7, drop7.
• fc8 (1000).

Data Preparation (Training)

Data Preparation (Testing)

[Data Augmentation (Training)]

• Random crop.
• Horizontal flips.
• Color jittering.

Data Augmentation (Testing)

• Horizontal flip the images and average the final scores.

[Why 3 × 3 conv?] Stacked conv layers have a large receptive field.
• Two 3 × 3 layers — 5 × 5 receptive field.
• Three 3 × 3 layers — 7 × 7 receptive field.
• But stacked 3 × 3 layers have more non-linearity, which make the decision function more discriminative.
Less parameters
• E.g., both the input and output size are D × H × W .
• A single 7 × 7 layer has parameters: D^2 × 7 × 7 = 49 D^2 .
• Three 3 × 3 layers have parameters: 3 × (D 2 × 3 × 3) = 27 D^2 .

3 Training Details

使用动量为 $α= \text{动量}$ 的SGD算法进行优化。
• 批次大小设定为 $B=256$ 。
• 权重衰减系数设为 $\lambda= \text{权重衰减}$ 。
• 初始化网络中前向传播中的前 $K$ 个卷积层和后 $L$ 个全连接层参数值来自预训练模型。
• 其余权重从均值为 $\mu= \text{均值}$ 、方差 $\sigma^2= \text{方差}$ 的正态分布中随机初始化，偏置参数则置零。
• 基础学习率设置为 $\eta= \text{基础学习率}$ 。
• 经过 $E=74$ 轮训练。
• 当验证误差出现平台期（连续出现三次）时，将学习率除以十。

4 Results

Second place of ILSVRC-2014, for top-5 error
• 1 CNN: 7.0%.
• 7 CNNs: 7.3%.
• 2 best CNNs: 6.8%.

5 Analysis

• 当卷积神经网络应用于一块作物时，所得到的卷积特征图被零填充。
• 对于完全卷积的情况，在同一块作物的填充自然来源于图像周围部分（由于卷积操作和空间池化的作用），从而显著地增加了整个网络的感受野范围（receptive field），因此能够捕获更多上下文信息。

[LRN Does Not Improve Accuracy]

[Deeper is Better]
And 3 × 3 conv layer is better than corresponding 1 × 1 conv layer.

[Muti-Scale]
• Multi-Scale policy in training is better than fixed scale policy.

• Multi-Scale evaluation is better than fixed scale policy.

集合由两个表现最佳的模型组成相对于包含所有模型的方法来说更为优秀

6 References

[1]. ILSVRC2014 Talk. https://www.youtube.com/watch?v=j1jIoHN3m0s.

全部评论 (0)

还没有任何评论哟~

[深度学习论文笔记][Image Classification] Very Deep Convolutional Networks for Large-Scale Image Recognitio

Simonyan,Karen,andAndrewZisserman.“Verydeepconvolutionalnetworksforlargescaleimagerecognition.”arXiv...

VGGNet 《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》学习笔记

1.INTRODUCTION 作者开篇就说明了VGG的特点——深度，为啥可以这么深呢？因为卷积核的size小！ 2.卷积结构输入是224224的RGB图像，预处理是对于每个RGB值减掉了训练集的均值...

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

论文：VeryDeepConvolutionalNetworksforLargeScaleImageRecognition 该篇文章介绍了卷积网络深度在大规模图像识别环境中对其准确性的影响。

【论文阅读】Very deep convolutional networks for large-scale image recognition

论文简介：《VeryDeepConvolutionalNetworksForLargeScaleImageRecognition》文章出自牛津大学RoboticsReSearchGroup团队，在2...

VGG： Very deep convolutional networks for large-scale image recognition

1前言经过前面两篇文章的介绍，我们已经了解了LeNet5和AlexNet网络模型。但是总体上来说两者的网络结构几乎并没有太大的差别，仅仅，同时网络的深度以及参数的规模也没有太大的变化。在接下来的这篇...

VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition

一、论文研究背景、成果 1.论文研究背景自从2012年AlexNet将深度学习的方法应用到ImageNet的图像分类比赛中并取得stateoftheart的惊人结果后,大家都竞相效仿并在此基础上做了...

论文阅读：VGGNet—Very Deep Convolutional Networks For Large-Scale Image Recognition

论文阅读：VGGNet—VeryDeepConvolutionalNetworksForLargeScaleImageRecognition 1、摘要在这篇论文中，作者对卷积神经网络的深度对于其在...

VGG Net 论文解读 - Very Deep Convolutional Networks for Large-scale Image Recognition

提出者：VisualGeometryGroupVGG,OxfordUniversity 本文链接：https://arxiv.org/abs/1409.1556 简单概括：研究目标是卷积网络深度对图像...

深度学习研究理解10：Very Deep Convolutional Networks for Large-Scale Image Recognition

本文是牛津大学visualgeometrygroup（VGG）KarenSimonyan和AndrewZisserman于14年撰写的论文，主要探讨了深度对于网络的重要性；并建立了一个19层的深度网络...

Backbone-VGG[ICLR2015] Very Deep Convolutional Networks for Large-Scale Image Recognition

最近决定精度一下经典CNN网络，很多都是一直用封装的又比较好所以泛读的较多。这是第一篇大名鼎鼎的VGG 论文连接：<https://arxiv.org/abs/1409.1556 摘要主要贡献：使用...

是否确定退出登录?

[深度学习论文笔记][Image Classification] Very Deep Convolutional Networks for Large-Scale Image Recognitio

全部评论 (0)

相关文章推荐

[深度学习论文笔记][Image Classification] Very Deep Convolutional Networks for Large-Scale Image Recognitio

VGGNet 《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》学习笔记

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

【论文阅读】Very deep convolutional networks for large-scale image recognition

VGG： Very deep convolutional networks for large-scale image recognition

VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition

论文阅读：VGGNet—Very Deep Convolutional Networks For Large-Scale Image Recognition

VGG Net 论文解读 - Very Deep Convolutional Networks for Large-scale Image Recognition

深度学习研究理解10：Very Deep Convolutional Networks for Large-Scale Image Recognition

Backbone-VGG[ICLR2015] Very Deep Convolutional Networks for Large-Scale Image Recognition