Advertisement

卷积神经网络~单层卷积网络

阅读量:

卷积为何有效?

随后,在处理RGB通道时(即在彩色图片上),我们采用卷积运算)。此时其维度从原先的6×6扩展到了6×6×3,并进一步扩展至三维空间中的6×6×3结构。

在这里插入图片描述

同样地,在调整滤波器尺寸时(或者当设置滤波器大小时),其大小则被调整为6×6×3的形式。高度参数用于表示层的高度(height),宽度参数用于表示层的宽度(width),而通道数量则被称为#channels(通道数目)。需要注意的是,在输入数据与滤波器之间(或者在输入矩阵图像与滤波器之间),其中输入数据与滤波器的#channels必须一致。而输出结果的通道数则降回到1个。

在这里插入图片描述
  • 卷积为何有效?
在这里插入图片描述

执行卷积操作的具体步骤是:将一个尺寸为3×3×3的矩阵(将其视为正方体)放置于6×6×3的大矩阵中,并完成卷积运算。这说明输入矩阵与滤波器必须具有相同的通道数量以确保计算的有效性)。需要注意的是,在这种情况下滤波器能够访问到27个数值。

在这里插入图片描述

为了完成任务,我们需要遍历连续的27个数值,并将这些数值与滤波器在相应位置的参数进行点积运算,从而获得初始卷积输出。

  • 多方向边缘检测
    如果我们希望同时识别垂直边、水平边以及45度角的边等,并且想要在图像中发现多种类型的边界时该怎么办?
    或者,在尝试使用多个滤镜时该怎么办?
在这里插入图片描述

通过执行两步卷积操作并将结果叠加起来,在4×4的空间维度上具有两个通道的情况下称为一个输出立方体

单层卷积网络

在上例中我们已经利用两个过滤器获得了两个输出矩阵,并将其组合成一个输出立方体。

在这里插入图片描述

将输入视为a^{[0]}(即x),并将其与两个滤波器\mathbf{W}^{[0]}\mathbf{W}^{[1]}进行卷积操作后,在两个输出特征图中分别加上对应的偏置项b^{[0]}b^{[1]}以获得结果\mathbf{z}^{[1]};随后对该结果应用非线性激活函数ReLU运算以获得a^{[1]}=g(\mathbf{z}^{[1]});这样一来我们就完成了神经网络的第一层卷积操作;具体而言,在这一过程后我们从6×6×3的输入体积转换为4×4×2的特征图;当使用了多个滤波器时(比如数量为n_f=256),输出特征图的维度将会扩展到4×4×256)。

  • 某一层卷积神经网络中的参数
在这里插入图片描述

如果我们拥有10组3×3×3的滤镜,则每一层卷积神经网络中的参数数量是多少?具体来说,在每个滤镜中需要计算27个权重加上一个偏置项(共计28项),因此在每层神经网络中总共会有164(即28乘以14.5)?不对,请等一下:这里可能需要重新审视计算方式)。

如果我们拥有1组由三个三维数组组成的滤镜,则每一层卷积神经网络中的参数数量是多少?具体来说,在每个滤镜中需要计算27(即3x3x3)个权重加上一个偏置项(共计28项)。如果使用了多于一组这样的滤镜,则总的权重数量会相应增加:例如使用两组则需乘以二(总计56项),以此类推。因此,在这种情况下每一层卷积神经网络都会包含固定数量的参数(即每组滤镜贡献一定数量的权重),无论输入图像大小如何变化这一特性也被视为卷积神经网络的一个显著优势

卷积神经网络中卷积层的标记总结

  • 如果l代表当前卷积神经网络的第l层卷积层:
    f^[l]代表过滤器的大小(以灰度过滤器为例,过滤器的阶数为f×f)。
    p^[l]标记padding的数量。
    s^[l]标记步长。
    ④某层的输入:nH^[l-1]×nW^[l-1]×nC^[l-1],这是来自上一层的激活值。
在这里插入图片描述

nC^[l]代表本层过滤器的个数。

在这里插入图片描述

该层自然也会产生输出。该层的输出数量为:nH^{[l]} \times nW^{[l]} \times nC^{[l]}。这一输出不仅提供了整体尺寸信息,并且具体指出了图像的高度和宽度。

在这里插入图片描述
在这里插入图片描述

注:之前演示的例子中输入与输出均为标准的n x × nx矩阵形式,在实际工程应用中矩阵长宽未必一致。
而本层的nC^[l]即为本层滤波器的数量。
⑦每个滤波器:其大小为f^{[l]}×f^{[l]}×nC^{[l−1]}的三维卷积核(kernel),其通道数量必须与输入数据通道数一致才能完成有效的三维卷积运算。
⑧经过偏差(bias)叠加并施加非线性激活函数(如Relu)后得到激活值Activations:a^{[l]}=nH^{[l]}×nW^{[l]}×nC^{[l]}。若采用批量处理的方式进行反向传播计算,则针对包含m个样本的数据集求取梯度时需将所有样本的结果相加操作即为:A^{[l]}=m×nH^{[l]}×nW^{[l]}×nC^{[l]}
⑨参数权重Weights:其计算公式为各层滤波器的空间维度乘以其数量之积即`W{[L]}=f{[L]}×f{[L]}×nC{[L−1]}×nC^{\mathcal{L}}}}(此处\mathcal{L}表示当前层)。 ⑩偏置量bias:数量为当前层滤波器数量即nC^{\mathcal{L}}}$。

全部评论 (0)

还没有任何评论哟~