Advertisement

经典图像 HOG 特征

阅读量:

图像特征提取在目标检测领域扮演着关键角色,在此过程中起着不可替代的作用。已有诸多开创性研究致力于开发不同类型的特征表示方法,在这一领域取得了显著成果如 LAB 特征、HOG 特征等。
其中 HOG 特征及其变体如 FHOG 主要依赖于图像梯度信息作为描述工具,在计算机视觉领域具有重要应用价值。

在一个图像中,
其外观特征可由梯度或边缘的方向密度分布准确地进行描述。

1.HOG

HOG特征于2005年CVPR会议上被首次提出,其全称为Histogram of Oriented Gradient.

1.1 HOG 算法的实现

输入图像作者采用的是没有gamma矫正的RGB颜色空间图像。

1.1.1梯度计算

如作者所述,在他的论文中指出,人脸识别检测器对于计算像素点梯度的方式特别关注。根据作者的研究发现,在大量实验的基础上认为最基础的方法往往表现最佳。即通常不考虑对图像进行高斯平滑处理的情况

这里写图片描述

-X方向的分梯度模板;

这里写图片描述

-Y方向上的分梯度模板。利用这两个模板遍历整个图像过后,每个点都具有在x和y方向两个分梯度值,通过这两个值利用以下的公式可以计算出总的梯度值,和角度。
!\[这里写图片描述

角度计算公式

考虑彩色图像(即可能包含多个通道的图像),在每个通道中计算相应的值,并选择梯度最大的通道作为该像素点对应的梯度向量

1.1.2 空间/方向bin投票

下一步骤就是要将梯度向量进行聚合。
每个像素都拥有独立的投票区域。这些区域是通过将图像划分为若干个互不重叠的小块来实现的。具体而言,在一个64×128像素的图像中进行划分后……
例如,在一个64×128像素的图像中进行划分后……
每个小块(cell)具有尺寸为8×8,并且各个cell之间没有重叠区域。

大

在每一个单元格内,我们为方向进行投票。需要注意的是,在这一领域中,“无符号”与“有符号”的区别至关重要——前者适用于角度范围为[−π, π]的情况(即−180°至+180°),而后者则对应于[−365°至+365°)。该论文采用的是基于无符号梯度的方向投票方法——即通过将范围均分为9个子区间来实现对角度的选择性响应。每个像素对应的投票值等于其实际计算出的梯度大小数值

在投票过程中为了 减少 采样模糊现象 ,我们将 采用线性插值技术来进行票数统计。即从该点分别向60度方向转移15票及80度方向转移5票。

1.1.3 构建Block和归一化

在一幅图像中,像素点梯度的大小范围会因光照条件及前景与背景对比度的改变而发生显著的变化。因此,在这种情况下,一种可靠的方法就是基于局部cell的对比度进行归一化处理。

在HOG中局部对比度正则化的尺度是一个Block,Block的尺寸的大小是16X16,也就是一个Block中包含2X2个cell。另外每次block移动的步长为8 pixels,所以Block和Block之间是有重叠的,这样保证同一个cell的不同的归一化结果(cell在不同的Block中被归一化)能对最后的HOG向量都有贡献。
Block & normalization!\[这里写图片描述

每个Block的特征表示其包含的4个cell融合后的级联结构。即4 \times 9 = 36维。在图像中每次获取一个36维的Block特征后需对其进行归一化处理。归一化的方法种类繁多,在实际应用中通常采用以下几种:L1、L2、L2-Hys等。

论文的作者采用的是L2-Hys正则化方法
假设v是是36维未经正则化的向量,

这里写图片描述

表示的2范式,

这里写图片描述

是一个很小的值,防止除0错误。下面是L2-norm的方法
enter description here!\[这里写图片描述

基于该公式计算得出的结果,在每个维度上执行截断操作,并使每个维度的最大值限定在0.2以内。

1.1.4 final descriptor

对图像进行遍历扫描处理后每个块进行正则化处理然后将所有块的描述子汇总就能得到整体图片的特征

参考文献

HOG为用于人类检测的有向梯度直方图(由作者Navneet Dalal和Bill Triggs提出)。

全部评论 (0)

还没有任何评论哟~