Advertisement

CNN与图像识别

阅读量:

将我的文章搬运到这里

  • 卷积神经网络与图像识别背景

    • LeNet概述
    • ImageNet大规模图像识别挑战赛
  • 卷积与图像处理

卷积的概念解析是理解深度学习模型的基础之一。在图像处理领域中,图像卷机数据的本质内涵可以通过滤波器的空间对齐特性来解释。对于LeNet网络而言,其具体架构分析有助于我们更好地掌握经典卷积神经网络的工作原理。在手写数字识别任务中,可视化具体工作流程能够帮助我们更好地理解模型的运行机制。最后,在神经网络模型中,“神经元”与“权重”的位置及其作用机制可以通过深入阐述来揭示其重要性。

卷积神经网络与图像识别背景

LeNet概述

LeNet最初应用于深度学习领域的是卷积神经网络的一种。Yann LeCun以其自1988年以来的一系列成功更新而命名的作品被称为这一模型的灵感来源。当时该架构主要用于识别邮政编码等任务。LeNet的基本架构如下:

LeNet Workflow

近几年已有诸多新型架构基于LeNet的框架而发展而来然而尽管如此其核心理念仍源自于LeNet。

卷积神经网络源于20世纪90年代以来,在这一时期已经认识到具有里程碑意义的LeNet架构

  • 从1990年代到2010年代初期:卷积神经网络均处于初创阶段。
  • 2012年:Alex Krizhevsky发布AlexNet(LeNet的更深版本),赢得ILSVRC竞赛;其卓越表现开启了深度卷积神经网络的新纪元。
  • 2013年:Matthew Zeiler与罗伯特·费格斯提出的改进型AlexNet(即ZF Net)问鼎ILSVRC。
  • 2014年:Szegedy等人研发GoogleNet(Inception系列的开篇之作),通过引入Inception模块显著降低了网络参数数量(四百万)。
  • 该年ILSVRC亚军是VGGNet团队开发的VGGNet系列模型;其关键贡献在于发现网络深度对性能提升的重要性。
  • 2015年:Kaiming He团队提出的残差学习框架ResNet成为ILSVRC冠军;该方法现已成为深度卷积神经网络的标准选择(直至2016年5月)。
  • 2016年8月:Gao Huang及其合著者发布DenseNet论文;该模型通过密集连接各层实现信息传递,在多个复杂分类基准测试中展现了显著优势。

ImageNet大规模图像识别挑战赛

参见网页:ImageNet 2017竞赛成为最后一篇挑战赛;WebVision或其他比赛或许接替。(http://www.sohu.com/a/143751643_473283)

上面介绍的不同版本的卷积神经网络模型主要起源于一次国际性竞赛(除了DenseNet之外):ImageNet大规模图像识别挑战赛(ImageNet Large Scale Visual Recognition Competition, ILSVRC).

ILSVRC是利用ImageNet图像库开展的一种图像识别竞赛。 ImageNet常被视为计算机视觉研究者在进行大规模物体识别与检测任务时首先想到的视觉大数据源。 ImageNet 数据集最初由斯坦福大学的李飞飞等研究者于CVPR 2009年发布的一篇论文中提出,并被用作替代PASCAL数据集(该数据集在规模与多样性方面均不及ImageNet)。 同时也被用来取代LabelMe数据集(该数据集在标准化程度上不及ImageNet)。

ImageNet不仅是推动计算机视觉发展的关键平台,在深度学习浪潮中也扮演了核心角色。截至2016年, ImageNet包含逾 billions of images by humans, 即标注过的图像. 这些标签明确了图像中的具体内容, 超过2.2万个类别可供分类和研究.

CVPR2017研讨会“超越ILS thoroughly”将宣布ImageNet竞赛正式组织的一年之际,在2016年的ILSVRC图像识别竞赛中已出现约2.9%的识别错误率。这一数字不仅远超人类水平(5.1%),而且未来继续举办此类挑战的意义也不大了。这标志着时代发展的一个重要转折点:计算机视觉的新征程由此开启;其中一项重要研究方向是苏黎世理工大学与谷歌等机构共同提出的WebVision挑战赛——该赛事将于CVPR2017同期举行;其重点在于推动网络数据的学习与理解研究

历届ILSVRC的比赛作品中可查阅ILSVRC历届冠军论文笔记,该资源涵盖了模型架构与识别性能相关内容。

卷积与图像处理

卷积的定义

convolution definition demo

参考Convolution

图像卷积的物理意义

卷积矩阵也叫“滤波器”、“核”或“特征探测器”。

image convolution
Image Filter

作为参考资料,《Wikipedia上有关图像处理核的文章》提供了详细信息

LeNet详解

该教程详细介绍了卷积神经网络的基础知识,并提供了相关的学习资源链接:Basics of Convolutional Neural network (CNN).

  1. 卷积操作的核心组件
  2. 池化操作的关键组成部分
  3. 全连接操作的核心模块
  4. 深入解析训练流程

关于Convolutional Neural Networks这一领域的直观解释相当出色!](https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/) 在博客..net/lcy7289786的文章中详细介绍了!

手写数字识别过程可视化

cnn visualizatio

官方网站:
http://scs.ryerson.ca/~aharley/vis/

3D可视化:
http://scs.ryerson.ca/~aharley/vis/conv/

2D可视化:
http://scs.ryerson.ca/~aharley/vis/conv/flat.html

相关论文:
http://scs.ryerson.ca/~aharley/vis/harley_vis_isvc15.pdf

神经网络中的“神经元”和“权重”在哪里?

convolution and weights

在各个卷机滤波器内部的位置参数中包含了我们需要训练的一系列权重参数(其中,在设计时已经确定好了卷积核的具体尺寸),每一个图像像素都与一个神经元相联系

其神经网络的基础知识可以通过TensorFlow Playground进行深入学习

全部评论 (0)

还没有任何评论哟~