为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢?
发布时间
阅读量:
阅读量
为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢?


(1)3x3是最小的能够捕获像素八邻域信息的尺寸。
(2)两个连续应用的[...]导致的感受野大小为[...];而当使用三个这样的滤波器时,则会扩大感受野到[...]。因此,在不增加计算复杂度的前提下可以采用多组小尺寸(如[...])替代单个大尺寸(如[...])滤波器以减少计算量。具体而言,在深度学习模型中通常将多个较薄的小滤波器组合起来可以达到类似单个厚实的大滤波器的效果,并且其中间层引入了非线性变换,并具有隐式的正则化功能。
在VGGNet论文中对此进行了详尽阐述。主要可以从以下两个方面进行分析:其一,在保持相同感受野的同时捕捉更多空间信息方面,默认采用较小尺寸的卷积核更为高效;其二,在采用了更多小尺寸滤波器后(这使得每个小尺寸卷积所需的计算量与大尺寸滤波器相当),从而使得CNN能够学习出更具区分力的空间映射关系。
全部评论 (0)
还没有任何评论哟~
