计算机视觉(CV)中HOG算法
1 HOG算法介绍
该方法基于方向梯度直方图(Histogram of Oriented Gradient, HOG)是一种用于计算机视觉和图像处理中的物体检测特征描述子。该方法通过计算并统计图像局部区域的方向梯度分布来构建其特征。该HOG特征与支持向量机分类器结合在一起,在图像识别领域得到了广泛应用,在人行 detection 中取得了显著成效。值得注意的是,该HOG+SVM方法用于人行 detection 是由法国研究人员Dalal在其2005年的CVPR论文中提出的,在当前依然有许多新的行人检测算法不断涌现出来,并且基本上都是基于此思路发展的
2 主要步骤
2.1 标准化gamma空间和颜色空间
为减少光照因素的影响
2.2 计算像素点的梯度
首先对图像进行x轴与y轴方向上的梯度计算,并以此为基础求取每个像素点处的具体梯度方向值;这种运算不仅可以有效识别边缘轮廓、人体阴影以及细节纹理信息,在增强图像细节的同时也能有效地减少由于光照变化带来的干扰影响。
通常采用的方法包括先将梯度算子[-1, 0, 1]应用于原图像进行卷积操作;这一步骤可获取X方向(即水平方向,默认向右为正)的梯度分量gradscal_x;随后使用[1, 0, -1]^T这一特定类型的梯度算子再次作用于原图像;这一步骤可获取Y方向(即垂直方向,默认向上为正)的相应梯度分量gradscal_y;最后利用上述方法计算该像素点处的梯度大小及其对应的方向
2.3 为每个细胞单元构建梯度方向直方图
第三步的主要目标是旨在对局部图像区域进行编码,并且该编码机制对于人体对象的姿态和外观具有弱鲁棒性。
我们将图像划分为多个'单元格'或'cell'结构,并设定每个cell占据6×6个像素的空间。为了统计这些区域内的梯度信息,在每个cell内部构建一个包含9个bin的直方图。具体而言,我们将cell内所有像素的梯度方向进行360度划分,并将其划分为9个离散的方向块(如上文所述)。其中某个pixel的梯度方向在20-40度范围内时,其对应的第2个bin计数值会增加1。随后,我们对每个pixel进行梯度方向在直方图中的加权投影(映射到固定的离散角度范围内),最终生成该cell对应的9维特征向量(因为总共有9个不同的方向块)。

在应用像素梯度方向时,请注意其对应的梯度大小如何处理?具体而言,在投影过程中,梯度的大小被用作权重系数。例如,在某个特定像素中,其计算出的梯度方向落在20至40度之间,并且其计算出的具体数值决定了直方图第2个bin(即对应该范围)内的计数值不再是简单的加一而是根据权重系数进行相应的增益操作。因此,在投票过程中对应的计数值不再是简单的加一而是根据权重系数进行相应的增益操作。
2.4 把细胞单元组合成大的块(block),块内归一化梯度直方图
因局部光照条件的改变以及景物与背景对比度的变换所导致,梯度强度的变化幅度显著增大。因此必须对其进行归一化处理。该处理能够有效地将光照变化、阴影细节以及边缘特征进行压缩,并将其数值范围压缩至一个较为合理区间内(这与机器学习中特征参数的标准化处理方式具有相似之处)。
作者采用了整合各个细胞单元为较大且在空间上相互连接(blocks)的方法。
这样的设计使得在每个block内部将所有cell的所有特征向量串联起来从而得到该block对应的HOG特征。
由于这些区间相互重叠的原因每一个单元格的所有特征都会以不同的形式多次出现在最终构建起来的整体特征向量中。
经过归一化处理后的块描述符(即每个block对应的向量)我们统称为HOG描述符。
区间有两种主要的几何形状——矩形区域(R-HOG)和环形区域(C-HOG)。其中R-HOG大致上是由若干方形格子构成的主要区域,并由三个参数进行表征:每个区域内所包含的细胞单元数量、每个细胞单元内部所包含的像素点数量以及每个细胞内直方图通道的数量。
例如,在行人检测领域中采用的理想参数配置包括以下设置:每个区间内使用 、每个cell包含 并采用九个 histogram channels以捕捉细节信息。由此可知,在一个特征块中包含有( ( ③ × ③ ) × (⑥ × ⑥ ) ) × ⑨ = ④⑧⁶个 feature points.
2.5 收集HOG特征
在最后阶段, 我们需要从检测窗口中收集所有重叠区域的HOG(Histogram of Oriented Gradients) 特征, 并将这些特征整合成一个完整的特征向量来作为分类的基础.
2.6 检测器窗口及其上下文的设置
researchers Dalal采用了具有64×128像素尺寸的检测窗口;该区域外围设置了一个行人周围的16像素空间间隔
2.7 分类器
默认情况下,使用的是软化线性向量机;也可以使用高斯核向量机。
2.6 总结:那么一个图像的HOG特征维数是多少呢?
基于Dalal等人提出的HOG特征提取方法中
