基于内容的图像检索系统常用特征简介
1.前言
基于内容的图像检索(Content-Based Image Retrieval, CBIR)是一种以查询式的内容为依据,在图像数据库中识别出与之匹配的图像的技术。该方法通过从图像中自动提取出一系列特征参数来进行计算与比较,在这一过程中能够有效地提取出符合用户需求范围内的匹配结果集合,并且这种结果处理过程能够借鉴并优化现有文本检索技术中的相关反馈机制。目前而言,在计算机视觉领域内绝大多数图像检索系统的实现基础都是对底层特征信息数据进行计算与比较操作的基础上完成的,也就是常说的"视觉相似"原理。
在CBIR中核心在于利用图像的可辨识特征来进行检索操作。从本质上说,这是一种近似匹配技术,涉及多个领域如计算机视觉、图像处理等,其中特征提取与索引构建过程均可由计算机系统自动完成,从而减少了人工描述所带来的主观性。通常情况下,用户可通过提供一个样例图片(Query by Example)或绘制草图(Query by Sketch)等方式进行检索,系统会从查询图片中提取相关特征并进行比对,最终将与查询图片具有相似特性的结果返回给用户。其核心技术体现在两个关键方面:首先是基于内容的信息检索机制,其次是高效可靠的数据库支持;本文重点阐述当前CBIR系统中最常采用的那种三种视觉特性作为其核心研究内容
2.颜色特征
颜色是物体表面的一种视觉特性,每种物体都有其特有的颜色特征,比如人们一提到绿色往往联想到树木或草原,提到蓝色往往想到大海或蓝天,同一类物体往往有着相似的颜色特征,因此我们可以根据颜色特征来区分物体。一般采用直方图来描述颜色特征,直方图描述的是不同颜色的像素在整幅图像中所占的比例,也可以理解为颜色直方图统计图像中每种颜色出现的概率,然后对颜色之间的距离采用直方图相交的方法来度量每个颜色直方图之间的相似性,进而进行排序实现图像检索的功能。后续又在颜色直方图的基础上衍生出累加颜色直方图、颜色矩(一般取前三阶矩)、颜色相关图等颜色特征来进行图像检索,这里不再一一进行说明。从上面的介绍中可以看出颜色特征主要考虑各种颜色的比例分布,但这些算法并未考虑人眼对分布于不同空间的、比例相同的颜色的感受差异,例如:某一包装盒的表面由于是亮面的,当在强光照射下,部分区域如图中用红色标记的区域很难分辨出其真正的颜色,进而也就导致在计算颜色直方图等统计特征时出现偏差,进而导致检索结果不准确,同时颜色特征这种统计特征并不能确切的给出查询图像是什么具体的物体,只能给出具有相同颜色分布的图像,因此常常用来作为检索系统中进行初级检索的特征。
3.纹理特征
纹理特征主要体现图像像素灰度集或颜色的某种规律性变化。基于纹理的检索一般可分为统计方法与结构方法两大类。
该统计方法主要通过分析图像像素灰度分布特征来识别纹理特性及其与其他参数之间的关系。目前最为广泛认可的是Tumura等人提出的基于人类视觉感知理论的纹理特征模型,在这一模型下较为常见的参数包括粗糙度、对比度、方向度、线像度、规整度和粗略度等指标中。其中较为常见的参数包括粗糙度、对比度和方向度等指标在实际应用中表现更为突出。该方法主要被用于分析具有细密而不规则纹理特性的物体表面如木纹、沙地以及草地等场景
结构方法主要依据纹理基元及其排列规律来表征纹理特征。这种分析方法特别适合对图像中具有明显结构规律的关键特征进行研究。它不仅适用于由类似布料或砖瓦等单一元素构成的纹理类型,并且也能够处理那些排列较为规整的物体类别的检索工作。
4.形状特征
形状特性是表征图像内容的重要特征,在计算机视觉与模式识别领域具有重要意义的问题。目前用于图像检索的主要形状描述方法可分为两类:一类是基于边缘检测的方法...另一类则是基于区域划分的技术...其基础在于精确有效的边缘检测技术,并通过提取包括面积、周长、偏心率等多种几何参数来表征物体形态特征;而该技术的核心挑战是如何高效准确地从图像中分离出人们感兴趣的具体物体...]
形状特征通常与图像中特定的目标对象相关联,在这一层次上与其他如颜色、纹理等低层特性的表达相比具有更高的抽象性与复杂性度量值。
对形态信息从表征到建模的过程而言,在表征复杂性上较之于颜色与纹理具有显著高阶性。
为了实现形态特性的精确描述与有效建模,在形态信息捕捉过程中必须考虑到其高度复杂性这一本质属性。
基于形态特性的模型构建是一个涉及多学科前沿技术交叉融合的研究方向。
值得注意的是,在缺乏相关领域专业知识的情况下, 自动化的形态信息捕捉技术难以实现精准的目标区域分离。
此外,在不同视角下的目标形态信息呈现形式也会产生较大差异, 这使得形态特性的统一化表征成为一个极具挑战性的研究课题。
为了确保形态信息建模过程不受外部环境因素干扰, 需要在模型设计阶段充分考虑形变特性的影响因素并采取相应的抑制措施。
基于以上几点原因阐述后, 可以看出目前基于形态特性的图像检索技术仍处于理论研究阶段, 其实际应用价值仍有待进一步提升
5.总结
本文着重阐述了业界通用图像检索系统所采用的核心特征及其特点。这些核心特征的一个显著共同点是其提取效率较高;系统输出的结果是按相似度从高到低排列的一系列TopN图像;经过对多个图像检索引擎的实际测试后发现,该系统的检索成功率仍有提升空间;由此可见,在目前介绍的各种特征中找到能够精确命中目标(Top1)的方法仍显困难;为了提高系统的性能表现,在现有条件下优先选择SIFT算法进行特征提取是一种可行策略;然而带来的问题是计算效率相对较低;如何将这种空间分布关系融合到现有的几种核心特征也是一个值得深入研究的问题
