Advertisement

基于MATLAB的图像分割算法

阅读量:

摘 要

本文从原理及应用效果两个方面对经典的图像分割方法进行了详细分析。通过对梯度算法中Roberts、Sobel、Prewitt等算子及其拉普拉斯(Laplacian)算子、LoG(Laplacian-Gauss)算子以及坎尼(Canny)边缘检测器的具体工作原理进行对比研究发现:采用坎尼(Canny)边缘检测器所依据的3个基本准则能够实现最优的边缘检测效果。其中关键点在于阈值的选择;只有当合适的阈值被确定后才能有效地区分物体与背景;然而该方法仅在灰度变化显著且背景与物体界限明显的图像中表现最为突出;而区域增长的基本思想则是基于像素相似性形成新的区域

关键词:图像处理 图像分割

目 录(一般目录要求最多是三级目录,不要出现四级目录)

第一章 __绪论 1

__1.__1数字图像处理的基本特点 1

__1.__1 .1 数字图像处理的信息大多是二维信息,处理信息量很大(三级标题有问题) 1

__1.__1 .2 数字图像处理占用的频带较宽 2

__1.__1 .3 数字图像中各个像素是不独立的,其相关性大 2

__1.__1 .4 作合适的假定或附加新的测量 2

__1.__1 .5 数字图像处理后的图像受人的因素影响较大 2

__1.__2数字图像处理的优点 2

__1.__2 .1 再现性好 2

__1.__2 .2 处理精度高 3

__1.__2 .3 适用面宽 3

__1.__2 .4 灵活性高 3

__1.__3数字图像处理的应用 4

__1.__3 .1 航天和航空技术方面的应用 4

__1.__3 .2 生物医学工程方面的应用 5

__1.__3 .3 通信工程方面的应用 5

__1.__3 .4 工业和工程方面的应用 5

__1.__3 .5 军事公安方面的应用 5

__1.__3 .6 文化艺术方面的应用 6

__1.__4数字图像分割技术的发展概况 6

__1.__4 .1 基于分形的图像分割技术 6

__1.__4 .2 基于神经网络的图像分割技术 7

__1.__5 本文的主要流程图 8

第二章 __数字图像处理的处理方式 9

2.1 图像变换 9

2.2 图像编码压缩 9

2.3 图像增强和复原 9

2.4 图像分割 9

2.5 图像描述 10

2.6 图像分类(识别) 10

第三章 MATLAB 平台及其开发环境 11

3.1.MATLAB 的组成 11

3.1.1MATLAB 主要有以下几个部分 11

__a.__数值计算功能 12

__b.__符号计算功能 12

__c.__数据分析功能 12

__d.__动态仿真功能 12

__e.__程序借口功能 13

__f.__文字处理功能 13

3.2MATLAB 的特点 13

3.2.1 功能强大,可扩展性强 13

3.2.2 界面友好,编程效率高 14

3.2.3 图像功能,灵活且方便 14

3.3MATLAB 在图像处理中的应用 14

第四章 __图像分割概念及算法研究 16

4.1 图像分割的基本概念 16

4.1.1 图像分割定义 16

4.2 边缘检测方法(4.1和4.2之间不是并行关系) 17

4.2.1 边缘检测概述 17

4.2.2 边缘检测梯度算法 19

__a.__梯度边缘检测算法基本步骤及流程图 19

__b.__Robert 算子 20

__c.__Sobel 算子 21

d.Prewitt 算子 21

4.2.3 拉普拉斯( Laplacian )算子 22

__4.2.4LoG(Laplacian-Gauss)__算子 24

4.2.5 坎尼( Canny )算子 25

4.3 灰度阈值分割 27

4.3.1 阈值分割介绍 28

__a.__阈值化分割原则 28

__b.__阈值分割算法分类 29

4.3.2 全局阈值 30

__a.__极小值点阈值 31

__b.__最优阈值 31

__c.__迭代阈值分割 33

4.3.3 动态阈值 34

__a.__阈值插值 35

__b.__水线阈值算法 35

4.4 区域分割 37

4.4.1 区域生长的基本原理、步骤及流程图 37

4.4.2 生长准则和过程 40

__a.__灰度差准则 40

__b.__灰度分布统计准则 41

__c.__区域形状准则 42

4.4.3 分裂合并 43

第五章 __总结 45

5.1 对于图像边缘检测的分析 45

5.2 对于图像阈值分割的分析 45

5.3 对于图像区域分割的分析 46

5.4

参考文献 48

__ 49

__ 50

第一章 绪论

1.1数字图像处理的基本特点

1.1.1****数字图像处理的信息大多是二维信息,处理信息量很大

对于一张分辨率256×256的低分辨率黑白图像而言,其所需数据量约为64kbit;而当处理一张高分辨率彩色图像尺寸为512×512时,则需768kbit的数据量;若用于处理每秒30帧的电视视频序列时,则每秒所需数据量将介于约0.5Mbit至约22.5Mbit之间。由此可见,计算机必须具备相应的计算速度与存储容量以满足这些需求。

1.1.2****数字图像处理占用的频带较宽

相较于语言信息而言,在频带占用方面要大多个数量级程度上来说例如电视图像信号所占频率范围约为5.6MHz相对而言语音信号仅占约4kHz因此从成像到传输再到存储处理显示等多个环节实现起来都面临较大的技术挑战并且成本也相应提高这使得频带压缩技术必须具备更强的能力来应对这一挑战

1.1.3****数字图像中各个像素是不独立的,其相关性大

在图面上上常见有很多pixels具有相近或相同的亮度值。而在电视图上,在同一行内的相邻两个pixels或上下行间的pixels之间有着极高的相关性。因此,在图像处理技术中信息压缩的方法显示出显著的信息压缩潜力。

1.1.4****作合适的假定或附加新的测量

由于图像是作为三维物体向二维平面的投射结果,在单一图像中无法完整恢复三维场景的所有几何细节。显而易见的是,在二维图像中无法完整呈现三维物体的所有细节信息。为了深入解析三维景物特性,则需基于合理假设并结合新增测量手段进行补充研究。例如通过双目摄像头获取深度信息或者采用多视点成像技术来补充缺失的数据量。实现对复杂场景的理解则需依赖于先验知识的支持

1.1.5****数字图像处理后的图像受人的因素影响较大

由于人的视觉系统极其复杂,在不同环境下受到多种因素的影响而表现出差异性特征,在图像质量评价方面仍有许多工作要做。另一方面,在计算机视觉领域中所研究的内容必然会影响计算机视觉研究领域的进程。例如,在人类感知理论中涉及的问题如感知的基本单元是什么?这些基本单元是如何构建起来的?局部感知与整体感知之间存在怎样的关系?优先敏感的空间结构及其属性特征又是如何分布存在的?这些问题都属于心理学及神经心理学领域正在深入探索的内容。

1.2数字图像处理的优点

1.2.1****再现性好

数字图像处理与模拟图象处理的主要区别在于, 由于其不涉及存储.传输或复制等操作步骤, 因此能够有效避免图像是由于这些过程而造成的质量下降或降低.只有在数字化过程中完整地捕捉了原始信息, 数字图象处理过程才能确保始终能恢复出原始图象的信息内容

**1.2.**2处理精度高

借助当前的技术手段,基本上可以将任何一幅模拟图像数字化为具有任意尺寸二维数组的形式。

借助当前的技术手段,基本上可以将任何一幅模拟图像数字化为具有任意尺寸二维数组的形式

1.2.3****适用面宽

该种数据源可能包括可见光成像、不可见光成像(如X射线、γ射线以及超声波等)、以及红外成像等多种类型。
在所反映的物理实体尺度上,则可以从最小可达到电子显微镜级别的细节扩展至最大可达航空照片或遥感影像直至天文望远镜级别的观测结果。
这些来自不同数据源的信息一旦被转换为数字编码形式后,则通常以二维数组的形式表示灰度图(而彩色图像是由红绿蓝三个灰度图组合而成)。
因此,在计算机系统中处理这些数字化后的数据非常方便。

1.2.4****灵活性高

图像处理大致可分为像质改善、图像分析与图像重建三个主要领域。由于光学成像原理仅能执行线性运算这一特点,则严重限制了光学图像处理所能达到的目标效果。相比之下数字图像处理则具备更强的灵活性不仅能够完成线性运算而且还可实现非线性运算即凡是可以用数学公式或逻辑关系加以描述的各类运算均可由数字成像系统来完成

1.3数字图像处理的应用

图像是人类获取与交换信息的主要来源之一。由此可见,图像处理的应用领域必然广泛涵盖人类生活与工作的各个方面。随着人类活动范围的不断扩大发展,其应用领域也将随之相应地扩大。

1.3.1****航天和航空技术方面的应用

数字图像处理技术在航天与航空领域有着广泛的应用,在此之外的另一重要领域是航空遥感与卫星遥感技术的发展与应用方面。各国通常派遣大量侦察飞机对感兴趣区域实施空巡作业,在获得照片后通过数字化处理系统对其进行分析解读以替代传统的人工判读方式已显现出显著优势:人力成本大幅降低同时效率得到显著提升更重要的是能够从影像中提取人工难以察觉的价值丰富的情报信息库60年代末以来美国及其国际组织先后发射了多代资源遥感卫星如LANDSAT系列以及SKY-LAB等项目由于飞行器姿态环境条件等因素的影响这些卫星所获取的画面质量不可避免地存在一定的局限性因此单纯依靠低成本的人工判读来获取图像并非经济合理的解决方案必须依赖于先进的数字图像处理技术以满足复杂场景下的精准分析需求

例如LANDSAT系列陆地卫星系统采用了多波段扫描仪(MSS)从距地面900公里的高度连续覆盖全球各区域并按18天周期完成扫描成像任务其画面分辨率可达到地面15米至1公里不等的数据精度(如1983年发射的LANDSAT-4号卫星其分辨率可达30米)。这一系列图像经过数字化编码后形成连续不断的数字信号存于磁带中当卫星飞临地面观测站上空时便可通过高速通信网络将这些数据实时传输至地面数据处理中心随后通过专业的数字图像处理系统对其进行分析解读从而实现信息的有效提取与利用

1.3.2****生物医学工程方面的应用

数字图像处理在生物医学工程领域得到了广泛应用,并取得了显著成效。除了前述提到的CT技术之外,在医用显微图像处理与分析方面也取得了重要进展。这包括红细胞、白细胞分类、染色体分析以及癌细胞识别等技术的应用。此外,在X射线 computed tomography(CT)成像技术中的图像处理、超声波图像处理以及心电图信号的解析与分析等方面都得到了广泛的应用和发展。这些先进技术不仅提升了诊断精度,还在立体定向放射治疗中的精准定位技术等方面发挥了重要作用。

1.3.3****通信工程方面的应用

当前通信的发展趋势是以声音、文字、图像和数据相结合的多媒体通信模式为主流方向。具体而言,则是以电话网络、电视网络和计算机网络实现"三网合一"的方式,在数字通信网络中进行整合。其中图像通信技术最为复杂与棘手,其特点是信息量极大。例如,在彩色电视信号传输方面可达到每秒100兆比特以上的传输速率。为了能够及时有效地传输如此高比特率的数据流量,必须采用高效的编码技术来压缩信息数据量。从另一个角度说,在整个数字化转型过程中实现数据高效传输的技术发展水平直接决定了该领域的成功与否。除了已应用较广泛的熵编码、DPCM编码、变换编码外,在这里我们重点讨论的是新型编码方法的应用前景与发展趋势

1.3.4****工业和工程方面的应用

其在工业与工程领域的应用极为广泛。例如,在自动装配线上用于对零件质量进行检测并分类,在印刷电路板上实施疵病检查,在弹性力学照片中进行应力分析,在流体力学图片上评估阻力与升力,在邮政信件处理系统中实现自动化分拣能力,并在有毒或放射性环境中识别工件及其排列状态,在先进设计与制造技术中运用工业视觉等技术手段。

1.3.5****军事公安方面的应用

在军事领域中,在导弹追踪与精确制导方面应用广泛。该技术不仅用于多种侦察照片图像的数据解析工作,在军事自动化指挥系统中也具备图像采集、传输、存储与显示功能。此外还用于模拟训练的各种飞行器(如飞机)、坦克以及船舶系统的应用实例。在公共安全领域的图像数据处理与分析技术也被广泛应用。其中指纹识别作为一项核心技术受到高度关注的同时人脸鉴别技术也在不断进步并可有效处理 incomplete 或 partial 图像数据以恢复其原始形态。此外该技术还可应用于交通监控及事故案例分析工作目前已有多个高速公路不停车自动收费系统的建设项目采用该项先进技术以实现高速公路上无需停车即可完成车辆与车牌信息采集的技术实现

1.3.6****文化艺术方面的应用

此类应用不仅包括电视画面的数字化处理以及动画制作等技术领域,还涵盖了电子图像游戏领域的探索,纺织品设计、服装设计与制作并行发展,发型设计也得到了相应的发展,同时文物资料照片的复制与修复技术研究取得显著进展,运动员动作分析及评分体系逐步完善等,如今这些技术已逐渐融合并发展出一种新兴的艺术形式——计算机美术

通过计算机实现图像处理有两个主要目标:其一是生成适合人类观察与识别的图像;其二是使计算机能够自主识别与理解图像内容。无论出于何种目的,在图像处理过程中核心任务都是对包含丰富景物信息的画面进行分割操作。这种分割过程最终结果则是将整个画面划分为若干个具有特定属性的基本单元——即所谓的图像基元。这些基元相较于整幅画面来说更为简单明了,在后续处理中能够更加高效地被系统识别与分析。在描述这些基元时我们将其定义为具有独特标识性的属性集合即为特征;其中统计特性指的是可以通过数学方法定义并提取出来的指标例如直方图矩频谱等;而视觉特性则是指那些人眼可以直接感知到的基本要素如区域亮度纹理轮廓形状等这些视觉特征共同构成了对画面进行分割的基础依据

1.4数字图像分割技术的发展概况

1.4.1********基于分形的图像分割技术

以基于特征的方法而言,在图像分割领域主要包含两大核心环节:一是进行有效的特 征提取;二是进行模式聚类分析。其中最为关键的是如何有效提取出具有代表性的特 征值,并且这些特征值的质量将直接影响到最终的分割效果。只有具备高质量的代表性 样本才能确保后续分类算法能够取得令人满意的性能水平。

根据分类标准, 特征提取主要可分为三个类别: 基于特征、基于模型和基于结构. 其中, 基于特征的技术主要通过识别具有相似属性的区域及其边界来进行分类. 具体来说, 基于特征的方法主要关注图像中具有特定属性的区域; 而在另一种方法中, 通过假设一个基本的概率分布模型, 并将与该模型相关的参数作为提取的关键指标. 需要指出的是, 模型参数同样具备纹理描述的能力; 最后一种方法则可被视为前一种方法的一种具体实现形式.

基于模型的方法主要包含两类典型模型:一种是分形几何模型,另一种是随机模型。分形函数近年来确实受到了越来越多的关注与研究。B.B.Mandelbrot在系统总结自然界中非传统几何图形的特点后,在1975年首次提出了分形理论的概念。他所提出的分形定义为:若某集合A的豪斯道夫维数D大于其拓扑维数Dt,则称集合A为分形集或简称为分形体。这一定义并未附加其他任何限定条件要求。1986年Mandelbrot又提出了另一版本的分形定义:若系统的组成部分与整体之间具有某种相似性,则该系统即被称为具有自相似性的系统或整体;这一定义突出了自相似性的作用特点并深刻反映了自然界中大量存在的物体的基本属性特征;即无论是在形态特征上还是在功能特性上亦或是信息特征上以及时间维度与空间维度等方面都均表现出统计意义上的相似性特征;简单来说就是一个高于其拓扑维数D的空间或集合即可被称作一个典型的分形体;其显著的特点便是具有尺度变换下的不变性;而当前所研究探索出的一系列理论体系均属于这一范畴之内;目前而言该理论体系已成功地应用于图像压缩编码领域并取得了较为理想的效果表现;与此同时一些研究者也致力于将这一理论方法应用于自然纹理图像以及自然景物分割识别等问题中去;由于自然纹理通常都呈现出线性对数功率谱特性而其中对应的参数估计值即为相应的分数维数值因而利用分数维数值来表征自然纹理的相关特性这一方法具有一定的合理性和可行性

1.4****.2 基于神经网络的图像分割技术****

基于神经网络的图像分割算法具有实现的可能性

通过引入松弛标记技术和人工神经网络相关理论

类似的基于Hopfield类型的神经网络

1.5本文的主要流程图


图1-1 主要流程图


第二章 数字图像处理的处理方式

2.1图像变换

因为图像阵列规模较大,在传统空间域处理中运算负荷极大。

因为图像阵列规模较大,在传统空间域处理中运算负荷极大。

2.2图像编码压缩

该技术通过优化图像数据的编码过程,在不丢失关键信息的前提下显著降低了存储和传输所需的比特数。具体实施时可选择无失真压缩或有限失真压缩两种模式。其中编码算法作为核心组件,在该领域具有重要地位。它在图像处理技术中是发展最早且比较成熟的技术。

2.3图像增强和复原

该技术旨在提升图像是质量的主要目标,在去除噪声干扰的同时显著提升清晰度水平;它不受影响于图像退化的原因,并着重强调关注的区域。例如,在加强高频分量时可使物体边缘更加分明并细节更加突出;而在加强低频分量时则可降低噪声干扰的影响程度。该过程需基于降质过程建立"降质模型"之后利用滤波技术恢复或重建原始信息。

2.4图像分割

在数字图像处理领域中具有重要地位的技术手段是图像是的关键技术之一。该技术通过将具有意义的特征部分分离出来实现目标,在实际应用中其关键特征包括边界与区域等,并构成了后续图像识别与理解的基础工作。尽管目前已有许多边缘检测与区域划分的方法被提出并得到了广泛应用但仍然没有一种完全适用于所有类型图象的有效解决方案存在因此对于如何提高图象分割的效果研究仍是当前计算机视觉领域的重要课题

2.5图像描述

图像特征提取是图像识别与理解的重要基础手段。在二值化处理中可以通过分析物体几何特性来进行特征提取;而复杂图形通常采用二维形状特征进行表征;其中大部分应用主要分为边界特征提取与区域特征分析两类方法;近年来随着计算机视觉技术的发展,在三维物体处理技术研究的基础上,学者们提出了体积描述、表面展开法以及广义圆柱体模型等较为先进的二维形状表征方法。

2.6图像分类(识别)

图像分类(辨识)作为模式识别的重要组成部分,在实际应用中主要涉及对经过增强、复原或压缩处理后的图像数据进行分割与特征提取操作以实现判断分类的目的。传统的图像分类方法主要包括统计模式识别法和结构(句法)模式识别法等手段,在当前技术发展中逐渐被新型模糊模式识别技术和人工神经网络模型所取代或补充。

第三章 MATLAB平台及其开发环境

MATLAB自1984年起由美国MathWorks公司推向市场以来,经过近二十年的发展,现已被广泛认定为最优秀的科技应用软件之一. MATLAB不仅是一种直观且高效的计算机编程语言,同时也作为一个功能强大的科学计算平台.它以矩阵作为基本编程单元,整合了包括数值分析、矩阵运算、科学可视化以及动态系统建模与仿真等功能集合在一个易于使用的界面中.这种工具显著简化了科学研究与工程设计过程,特别适用于需要进行复杂数值计算的领域,提供了简捷而高效的解决方案. MATLAB还提供了大量专业的数学函数库与工程函数包,使工程技术人员能够在统一环境中完成各种计算任务.借助Alice提供的Alink接口,Alice提供了一种与C/C++及Fortran兼容的接口,允许开发者轻松调用现有用C/C++及Fortran编写的应用程序,实现更加灵活的扩展功能.

3.1.MATLAB的组成

3.1.1MATLAB主要有以下几个部分

MATLAB是基于其基础功能提供的一套完整的数值计算环境,在这一环境中包含了执行流程指令(control flow statements)、编写函数(functions)、管理数据结构(data structures)、进行输入输出操作(input/output operations)以及支持面向对象编程(object-oriented programming)特征的高级矩阵运算体系(matrix/array language)。 MATLAB不仅支持用户即时开发的小程序(small-scale programs),也能够构建功能丰富且复杂的大型应用系统(large-scale applications and systems)。

工作环境——MATLAB的工作环境是由使用者(包括 MATLAB 用户及程序员)共同使用的强大功能模块集合构成了 MATLAB 的工作环境。它负责处理用户的变量管理与输入输出数据的任务。除了提供集成开发环境外, MATLAB 还整合了多种辅助功能工具。

句柄图形——基于MATLAB上的图形系统。它涵盖了二维与三维数据的可视化表示以及图像处理等功能,并提供了执行绘图与展示功能的强大指令集;这些指令不仅支持全面控制图形外观,并且在用户的MATLAB应用程序中可被用来构建完整的用户界面(GUI)。

数学函数库——MATLAB整合了丰富的科学与工程计算算法库,在基础到高级层次上涵盖了各类数学函数。这些算法包括初等运算、复数处理以及矩阵运算等功能模块。该软件不仅提供直接调用接口,并且支持通过调用C或Fortran程序实现特定功能;同时将 MATLAB 作为(C 或 Fortran)计算引擎使用,并能够读写基于 MAT 文件格式的数据

基于其不断升级的功能库以及日益完善的技术生态系统的原因, MATLAB逐渐发展成为全球领先的科学计算与数学应用软件

a.数值计算功能

MATLAB凭借其卓越的数值计算能力,在众多数学软件中占据重要地位;而 MATLAB 6.1 版本以其极为完善的数值计算能力著称。

b.符号计算功能

科学计算主要分为数值计算与符号计算两大类,并非仅具备高效的数值运算能力无法满足科学研究与工程实践中的各种需求。在数学科学、应用科学以及工程领域中,经常会遇到需要进行符号运算的问题。1993年, MathWorks公司从加拿大Waterloo大学购买了Maple的核心技术,将其内核作为进行符号运算的核心技术,并以此为基础开发出了一种基于Maple内核,在MATLAB环境下实现符号运算的功能模块。

c.数据分析功能

MATLAB以其在科学计算领域的强大功能著称,并且同时在其数值计算结果的分析以及数据可视化方面的优势远超同类软件。 在科学计算及工程应用领域中,工程师和技术人员常面临海量原始数据及数值计算结果亟需处理的情况。 MATLAB能够将这些数据以直观图形呈现出来,并显著地揭示了它们之间的关系; 此外,对于深入挖掘数据的本质特征, MATLAB的作用尤为突出。

d.动态仿真功能

MATLAB提供了模拟动态过程的交互式Simulink工具包,它通过图形化界面允许用户创建并运行动态系统的模型。该工具不仅支持基本的线性系统建模还能够处理非线性的连续时间与离散时间系统。基于鼠标操作设计的Simulink让用户能够方便地进行系统的仿真实验

e.程序借口功能

支持便捷的方式使用应用程序接口(API),可以让用户在 MATLAB 环境中直接运行现成的 CFortran 子程序。同时实现了客户端/服务器架构的可能性。同样地,在 C 和 Fortran 程序中也可以使用 MATLAB 的函数指令。从而充分地利用了 MATLAB 强大的矩阵运算功能以及方便的绘图功能。

f.文字处理功能

通过整合MathWorks MATLAB平台与微软Word文字处理系统, MATLAB Notebook为用户提供了一个协同工作环境. 该平台提供了统一的文字处理与数值计算环境, 为各类工程设计提供高效解决方案. 不同以往, MATLAB Notebook能够轻松生成多样化的技术文档内容. 用户可以根据需求选择并定制个人使用的模板文件, 并可以自由插入各种各样的专业图表元素. 不仅如此, 不同以往, MATLAB Notebook能够轻松生成多样化的技术文档内容. 用户不仅可以利用word强大曲文字编辑处理功能极其方便地创建MATLAB的系统手册、技术报告、命令序列、函数程序以及注释文档等多种类型的技术性文件, 而且还可以通过Word直接调用强大的数值计算能力和卓越的数据可视化效果. 不论是简单的图形图像编辑还是复杂的三维数据展示都能满足需求.

3.2MATLAB的特点

总的来说,MATLAB有三大特点:

3.2.1********功能强大,可扩展性强

MATLAB语言不仅为用户提供丰富的数值运算、数据处理与图形展示、动态模拟系统以及高等数学和文本信息处理等功能,并且具备独特且显著的可扩展性特征。

MathWorks公司致力于不同领域的技术应用,在自动化控制、信号与信息处理、图像与视频处理等方面开发了包括但不限于模糊逻辑系统、神经网络模型以及小波变换分析等30多种专业性极强的MATLAB工具箱,并涵盖了通信系统设计、优化算法研究以及数理统计方法的应用等多个相关领域

该软件平台允许用户自由开展二次开发活动。这些应用程序既可作为新增功能加入现有的工具包中,也可发展成为独立的新工具包。经过多年的发展,在多个应用领域取得显著进展的专家团队已成功利用该软件平台开发出大量应用程序。

3.2.2界面友好,编程效率高

MATLAB是一种基于矩阵作为核心数据结构的编程语言,在界面友好性和实用性方面具有显著优势。其语法简单明了,在处理单一数据类型方面表现出色,并且指令表达式与常见数学公式高度相似。即使是缺乏计算机编程基础的用户,在学习难度上也远低于其他高级编程语言,在短时间内也能熟练掌握其主要功能和基本操作,并能够解决许多看似复杂却手工难以完成的任务。

MATLAB不仅能让用户省去了大量重复的基础数学运算而获得事半功倍的效果;此外,在编译与执行速度方面也明显快于采用C/Fortran语言开发的程序;在科学计算与工程应用领域的编程效率同样显著优于其他高级语言。

3.2.3图像功能,灵活且方便

在程序运行过程中,MATLAB提供了多样化的二维和立体绘图功能。快速且便捷地通过图形、图像、声音及动画等多种多媒体技术直观展示数值计算结果。该系统支持多种坐标系选择,并允许用户配置颜色、线型和视点设置。此外,生成的图像可将此插入到用户编写的Word文档中。

由于其诸多优势存在,在面对现代应用学科尤其是新兴领域如边缘学派与交叉研究时展现出了卓越适应性。迅速发展成为在计算机辅助分析与设计、教学实践以及科技文档处理等方面不可或缺的基础工具。

3.3MATLAB在图像处理中的应用

MATLAB的强大数字图像处理功能使其成为该领域的重要工具之一。其内置的图像处理工具箱(Image Processing Toolbox)涵盖了经典图像处理的核心内容:图像集合操作、邻域与区域操作、图像变换、图像恢复与增强、分割方法等;此外还提供了线性滤波器设计与应用的相关技术;同时涵盖了图像分析与统计指标计算;色彩空间操作以及形态学分析等功能模块;这些模块将数值分析、矩阵运算、信号处理以及图形显示融为一体,并通过强大的扩展功能为多个应用领域提供了基础支持。MATLAB工具箱系统主要包含以下几大类:信号处理(Signal Processing)、控制系统(Control System)、神经网络(Neural Network)、数字图像处理(Image Processing)、鲁棒控制(Robust Control)、非线性系统控制(Nonlinear System Control Design)、系统辨识(System Identification)、小波分析(Wavelet Analysis)等专业领域工具箱;此外还支持多种图像文件格式的读取、显示及处理功能;这些专业的工具箱体系为各领域的研究者和技术人员提供了强有力的解决方案。

对于图像集合操作而言,在MATLAB中实施了插值函数功能,并对其进行了尺寸调节以及任意旋转角度的设计。此外,在实际应用中可实现缩放、旋转变换以及裁剪处理等多样的操作选项。

在图像滤波领域中,在图像滤波方面

对于二值图像处理领域而言

第四章 图像分割的概念和算法的研究

Image segmentation is the process of dividing an image into distinct regions with unique characteristics. It is a technique used to extract interesting parts like objects or backgrounds. In the study and application of images, individuals typically concentrate on specific aspects, such as targets or backgrounds. To analyze and identify objects within an image requires careful segmentation and extraction.

图像是处理转为分析的核心任务

4.1图像分割的基本概念

4.1.1图像分割定义

关于图像分割的阐述与描述较多,在集合论的基础上对图像分割这一现象可给予如下较为严格的数学定义:

令集合R代表整幅图像的区域,对R的分割可看成将

个满足以下5个条件的非空子集(子区域)

;

②对所有的i和j,有i≠j,

Φ;

③对i=1,2,…,N,有P(

)=True;

④对i≠j,P(

)=False;

⑤i=1,2, …,N,

是连通的区域。

其中P(

)是对所有在集合中元素的逻辑谓词,Φ代表空集。

下面先对上述各个条件分别给予简略解释。条件①规定所有子区域的整体必须覆盖整幅图的所有像素(即原始图),这意味着通过分割过程使每个像素都被分配到一个特定区域内。条件②要求各个生成的区域彼此之间没有交集。条件③说明每个生成区间的独特属性各具不同。具体而言,在分割结果中的每一个子区域内所拥有的是一致性的属性或特征。而当比较两个不同的生成区间时,则会发现它们各自所拥有的属性或特征存在明显的差异性特征。最后一条附加说明则进一步细化了这一概念的具体表现形式——即同一生成区间内的所有像素必须形成一个连续连接的整体结构。

另外,上述这些条件不仅定义了分割的标准与方法( criterion 和 approach),也对如何实现有效的图像分割提供了指导原则(guideline)。通常情况下(in general),图像的分割过程都是基于特定的一套准则( criterion)来进行操作( perform)。这些条件表明,在任何区域和像素中都适用的有效性(effectiveness)是必须满足的前提(prerequisite)。而合理的准则(criterion)则应该能够帮助确定各区域中像素所具有的代表性特征(characteristic)。这一条则指出,在整个区域内像素必须保持连通性(connectivity)的前提下才能实现完整的图像划分(segmentation)。

最后必须强调,在实际应用中进行图像分割不仅要求将一张图像分割为满足上述五个条件的各自具有独特特征的区域,并且特别关注的目标区域被提取出来。这才算是真正完成图像分割的任务

4.1.2图像分割算法分类

图像 segmentation研究始终受到广泛关注。近年来已提出超过一千种不同类型的图像 segmentation算法。鉴于现有图像 segmentation方法种类繁多,为此也为它们的分类方法也提出了众多的可能性。其中一种常见的分类方法是将图像 segmentation技术划分为以下三类:边缘检测、阈值化方法以及基于区域生长的技术。然而实际上阈值化方法的本质上也是一种基于区域提取的技术,因此上述第三类方法实际上涵盖了第一类技术的内容

本章以实际应用为背景进行阐述,并全面阐述了图像分割以下使用的几种常见算法:包括分割检测、阈值分割以及区域生长等。

4.2边缘检测方法

4.2.1边缘检测概述

边(Edge)被定义为图像中亮度变化最为显著的区域。这些边界通常位于物体与其背景之间以及区域之间的交界处,并涉及不同色调的区域。这些边界构成了图像分割、纹理特征提取以及形状特征提取等关键环节的基础。在图像分析与理解的过程中,通常会首先进行边缘检测(Edge Detection)。鉴于其重要性,在机器视觉领域它是当前最为活跃的研究课题之一。本节将深入探讨边缘检测与定位的核心概念,并详细阐述几种典型的方法及其应用。

图像中的边缘主要体现于图像亮度或其一阶导数的不连续区域。在图像亮度变化中可分为两类:①突变不连续现象,在断裂处两侧像素灰度值差异显著;②过渡不连续现象,在断裂处亮度值从一个稳定值渐变到另一个稳定值后又缓慢回归原值。实际应用中这类边缘类型较为少见,因为大多数传感器具有低通特性导致断层处呈现斜坡状过渡(即变为斜坡型边缘),而平缓过渡则转化为屋顶型边缘(即变为屋顶形边缘),其中亮度变化不再瞬间完成而是持续经过一定距离的变化范围。

对一个边缘而言,在某些情况下可能同时具备跃迁特性和线状特性。例如,在一个表面上由一个平面转变至法线方向不同地另一个平面时就会形成跃迁边缘;如果这一表面具有镜面反射特性并且两平面形成的棱角较为圆滑,则当棱角圆滑表面的法线经过镜面反射角时由于镜面反射分量会在棱角圆滑表面上出现明亮光带这样的边缘看起来就像在跃迁边缘上叠加了一个线状边沿效果由于这种边沿往往与场景中物体的关键特征相对应因此它在图像特征分析中具有重要意义例如在一个物体的轮廓中通常会观察到跃迁边沿

在讨论边缘算子之前,首先给出下列术语的定义。

边缘点:图像中亮度显著变化的点。

边缘段:边缘点坐标[i,j]及其方向θ的综合,边缘的方向是可以是梯度角。

边缘检测器:从图像中抽取边缘(边缘点或边缘段)集合的算法。

轮廓:边缘列表,或是一条边缘列表的曲线模型。

边缘连接:经过无序边缘表的有序化处理过程。通常情况下,在表示边的时候采用顺时针方向。

边缘跟踪:一个用来确定轮廓图像(指滤波后的图像)的搜索过程。

边界的几何位置可以用图像行列索引号来表示,在亚像素分辨率下则可用更精细的位置信息来表达。在滤波器输出的空间中通常会采用该坐标系进行描述,并且由于滤波过程可能导致图像平移或缩放效应的存在,在实际应用中需要特别注意这些因素的影响。边界特征可以通过长度单位为像素宽度的小线段来描述,并且还可以采用带有方向性的点形式来表示。在工程实践中将这些特征统称为边界元素即可满足需求

通过一个方法将生成的两个集合分为真边界的集合和假边界的集合:其中真边界的集合与实际场景中的边界相对应;而假边界的集合并不属于实际场景中的边界;此外还有一个分类是漏掉的真实边界的集合;这个被称作假阳性(False Positive);同时没有被检测到的真正存在的边界则被称为假阴性(False Negative)。

边沿连结与边沿追蹤二者之间存在明显的差異:前者采用邊緣檢測器產出的無序邊緣集合作為輸入對象;後者則以一幀圖像為輸入並產出一個有序邊緣集合。此外,在邊緣檢測中我們主要根據局部位於信息來判斷是否存在邊緣;而在邊沿追蹤技術中則綜合整體圖像資訊來判定某一像素點是否為邊緣點。

4.2.2边缘检测梯度算法

a.梯度边缘检测算法基本步骤及流程图

梯度边缘检测算法有如下4个步骤。

  1. 滤波:边缘检测算法主要依据图像强度的一阶与二阶导数特性,在实际应用中由于导数计算对噪声较为敏感的特点,在执行边缘检测前必须采用滤波手段以优化相关滤波器的功能效果。值得注意的是,在大多数滤波方案中虽然能够有效降低噪声干扰程度的同时也会导致边缘检测灵敏度下降现象出现因此实现边缘增强与降噪目标之间往往需要找到一个平衡点。
  2. 增强:在进行图像增强时核心依据是评估各区域邻域内强度变化情况进而识别出具有显著变化特征的点集在此基础上通过计算梯度幅值的方式可将这些具有显著变化特征的点清晰地分离出来。
  3. 检测:图像中存在大量梯度幅值较大的点集但并非所有满足条件的区域均为实际存在的图像边界为了准确识别出真正意义上的边界通常会采用基于梯度幅值设定阈值条件的方法来进行初步筛选。
  4. 定位:当具体应用场景要求实现更高精度的边界定位时可以通过对梯度幅值及方向信息进行子像素级估计从而获得更为精确的边界位置信息同时也可以通过分析局部区域的变化趋势来进一步确认边界的方向特性。

在边缘检测算法领域中, 前三个步骤的应用极为广泛. 其原因是, 在绝大多数情况下, 只需让边缘检测器识别出边界存在于某个像素点附近即可, 而无需明确边界的具体位置及其指向.

在本文中着重探讨常用的几种边缘检测器,并利用这些函数执行边缘检测以生成效果图。

b.Robert算子

Robert交叉算子为梯度幅值计算提供了一种简单的近似方法:

(4-1)

用卷积模板表示方法,上式变成:

(4-2)

其中

由下面的模板(4-3)计算:

=

=

在计算梯度时,在计算过程中同一位置(x,y)处的精确偏导数值至关重要。使用上述所描述的2×2邻域模板所得到的梯度估计值能够较为精确地反映该区域的变化趋势

并不位于同一位置,

实际上是内差点

处的近似梯度,

实际上是内差点

计算得到一种近似的梯度向量。由此可知,“Robert算子可被视为该点连续梯度的一个估计值。”而并非预设的那个目标点。

处的近似值。所以,通常用3×3邻域计算梯度值。

c.Sobel算子

如前所述,在应用3×3邻域区域时可以绕开在像素之间的插值点处进行梯度计算

周围点的排列。

|

|

|

|
|---|---|---|
|

|

|

|
|

|

|

|

Sobel算子也是一种梯度幅值:

(4-4)

其中的偏导数用下式计算:

(4-5)

(4-6)

其中常系数c=2.

和其他的梯度算子一样

可分别用卷积模板表示为:

-1 0 1
-2 0 2
-1 0 1
1 2 1
0 0 0
-1 -2 -1

该算子着重作用于靠近模板中心的像素点。在边缘检测领域中,Sobel 算子被认为是最常用且最重要的工具之一。

d.Prewitt********算子

Prewitt与Sobel算子的方程完全一样,只是常系数c=1。所以

可分别用卷积模板表示为:

-1 0 1
-1 0 1
-1 0 1
1 1 1
0 0 0
-1 -1 -1

本段将利用MATLAB图像处理工具箱中的edge函数及其相关算子实现边缘检测。该工具箱为Edge函数提供了多种微分算子模板,在实际应用中可以根据特定需求选择水平或垂直方向的敏感性设置(即可以选择主要检测水平边、垂直边或是两者均有)。在进行边缘检测时,默认会应用一个全局灰度阈值标准;若要提高检测精度可自行设定一个合适的阈值范围。其基本调用语法及参数设置示例如下:

其中, input image I represents the input image, operator type denotes the operator used, and parameters are associated with the specific operator.

本研究采用Prewitt算子对图像4-2(a)进行边缘检测,并将结果展示在图4-2(b)中。程序清单放置于附录中,在第5节中详细介绍了其操作流程:随后将采用该方法对图像进行边缘探测。

(a)原始图像 (b)Prewitt算子检测的边缘

图4-2 边缘检测效果图

4.2.3拉普拉斯(Laplacian)算子

前面涉及到了基于一阶导数的边缘检测方法。当所求的一阶导数值超过设定阈值时,则可确定该区域为边界区域;然而这种做法可能导致边界区域被过度识别。一种更为有效的策略是通过寻找梯度局部最大值对应的点来确定边界位置(如图4-3所示)。根据图4-3所示,在使用阈值进行边界检测时,在a和b之间的所有中间区域都会被标记为边界区域;然而通过剔除那些非局部最大值的一阶导数值,则可以更为精确地定位边界位置。值得注意的是,在数学上一阶导数的局部最大值与之对应的是二阶导数的零交叉点(Zero crossing)。因此通过分析图像强度的空间二阶变化情况即可找到较为精确的边界位置;拉普拉斯(Laplacian)算子是一种常用的二阶导数空间变化测量工具。

图4-3 阈值边缘检测和二阶导数的零交叉边缘检测比较

经过光滑化处理后的step edges的二阶导数,在该处通过零点(见图4-2)。拉普拉斯算子是二阶导数的二维形式。

的拉普拉斯算子公式为:

(4-7)

使用差分方程对x和y方向上的二阶偏导数近似如下:

(4-8)

上式近似是以点

为中心的,以点

为中心的近似为:

(4-9)

类似地有:

(4-10)

将(4-9)和(4-10)两式合并为一个算子,用近似的拉普拉斯算子模板表示:

(4-11)

当拉普拉斯输出出现零点时,则预示着存在边缘;然而需要剔除掉灰度值为0的区域。

4.2.4LoG(Laplacian-Gauss)算子

前面所述的梯度算子与拉普拉斯算子本质上属于微分或差分算法;因此该算法对于噪声极为敏感;因此,在进行边缘检测之前必须先去除噪声;Mar与Hildreth将高斯滤波器与拉普拉斯边沿检测相结合;形成了Laplacian-Gauss(LoG)算法;LoG边缘检测器的基本特性体现在:

  1. 平滑滤波器属于高斯滤波器的一种类型;
  2. 增强过程利用二维拉普拉斯算子进行处理;
  3. 通过线性内插技术,在亚像素分辨率层次上精确定位边缘。

该方法的核心在于图像先与高斯滤波器进行卷积运算以达到平滑效果的同时有效去除噪声。尽管平滑操作可能导致边缘向外延伸的现象出现但边缘检测器通常仅识别那些局部梯度达到最大值的位置作为边缘点这一特性可以通过寻找二阶导数为零的位置来实现而拉普拉斯函数由于其无方向性的特点故被用作二维二阶导数的一种近似表示法为了避免误检不重要的边缘特征则需选择那些一阶导数值超过设定阈值的一阶零交叉点作为候选边缘

LoG算子对图像

进行边缘检测,输出

是通过卷积运算得到的,即:

(4-12)

通过平滑处理、增强效果以及实现3个步骤完成边缘检测的流程对LoG算子依然有效。其中高斯滤波器通过图像的平滑处理来实现;拉普拉斯运算将边缘点转换为零交叉点来实现;而边缘检测则通过分析零交叉点的位置信息来进行。

在上文中介绍过图像平滑处理的概念及其对图像效果的影响。使用高斯滤波器会导致图像中边缘及其他不连续区域出现模糊现象;其中模糊程度由σ参数决定。当σ值增大时,在一定程度上能增强噪声抑制能力;但这也伴随着关键边缘信息丢失的风险,并会直接影响到边缘检测器的表现;因此,在物体尺寸和位置未知的情况下难以准确确定最佳的σ值;通常情况下较大σ值得滤波器会产生较为鲁棒化的边界效果;较小的则能够实现更为精确定位;将两者结合起来既能减少信息丢失又能提高边界检测效率

LoG算子也可以用MATLAB中的edge函数来检测边缘:

BW=edge(I,’log’,thresh,sigma)

式中thresh是边缘检测的阈值,sigma是高斯滤波器的σ值,默认为2。

通过调整不同σ值的LoG滤波器来识别图像边界的变化情况。参考文献中的程序清单如附录所示。

(a) σ=2 (b)σ=3

图4-4 不同σ值的LoG算子边缘检测效果图

对比这两幅图像可以看出:较小的σ值其平滑程度较弱 可能会导致零散的伪边缘产生;而较大的σ值其平滑程度较强 但这又会导致大部分真实边缘被丢失 易出现边缘断续的现象

4.2.5坎尼(Canny)算子

检测阶跃边缘的核心概念是通过识别图像中对应于局部最大梯度幅值的像素点来实现。主要关注的是寻求一种能够在实际应用中使用的梯度数字逼近方法。由于实际图像在经历摄像机光学系统以及带宽限制下产生的低通滤波器平滑处理后变得相对平缓,在这种情况下难以观察到极端陡峭的边缘特征。此外图像还容易受到摄像机内部产生的噪声以及场景中不希望包含的细节信息的影响。为了满足以下两个关键要求:
①逼近方法必须具备抑制噪声干扰的能力;
②必须确保尽可能准确地定位边缘位置。
需要注意的是这两种目标无法同时完全实现:如果采用图像平滑算子来去除噪声从而提高算法鲁棒性,则会降低对边缘定位精确性的保证;反之如果增强算法对边缘特征的感受性则会显著提高对噪声信息的敏感度从而可能影响算法性能。
一种称为高斯函数一阶导数的传统算子可以在这种复杂的权衡关系中找到最佳折衷方案它不仅能够有效抑制噪声干扰还能提供较为精确的边缘定位效果。

在高斯噪声环境中(σ=1),一个典型的边沿(edge point)代表了跳跃式的强度变化(intensity variation)。基于这一模型(proposed by Canny),一个好的边沿检测算子应当满足以下三项评价标准:其一是具有低误报率(low false positive rate),即真正存在的边沿点应尽可能完整地被检测到,并且尽量避免将非存在边沿点误认为是实际存在的边沿;其二是具有高的定位精度(high localization),使得检测到的所有边沿均能精确地接近真实存在的位置;其三是每个真实的边沿仅产生单一响应(single response per edge point),从而实现单位像素宽度的理想化边沿提取效果。Canny提出了一种基于多尺度梯度计算与双阈值处理相结合的方法,在这一框架下提出了以下三条评估标准:

  1. 信噪比准则

信噪比越大,提取的边缘质量越高。信噪比

定义为:

(4-13)

其中G(x)代表边缘函数,h(x)代表宽度为W的滤波器的脉冲响应。

  1. 定位精确度准则

边缘定位精度L如下定义:

(4-14)

其中

分别是

的导数。L越大表明定位精度越高。

  1. 单边缘响应准则

为了确保单边窗仅对应一个响应,在检测算子中计算脉冲响应导数的零交叉位置的时间平均间隔。

应满足:

(4-15)

的二阶导数

基于上述评估标准和指导原则,在泛函分析框架下通过泛函求导的方法可以推导出其数学表达式接近高斯函数的一阶导数这一结论,并将其作为信噪比与定位效果的最佳逼近算子使用。具体而言,在以下步骤中阐述了其实施流程:第一步是对图像进行预处理以去除噪声;第二步是应用高斯滤波器进行平滑处理;第三步是对处理后的图像进行梯度计算并提取边缘特征;第四步是根据阈值筛选出候选边缘点;第五步是对候选边缘点进行进一步验证以去除误检;最终得到精确度较高的边缘检测结果。

  1. 通过高斯滤波器实现图像平滑;
    2. 采用有限差分法计算梯度幅值及方向;
    3. 执行梯度幅值的非极大值抑制;
    4. 基于双阈值方法实现边缘检测与连通。

坎尼算子也可以用MATLAB中的edge函数来检测边缘:

BW1=edge(I,’canny’,thresh,sigma)

式中的thresh是边缘检测的阈值,sigma是高斯滤波器的σ值,默认为2。

用Canny算子检测图像4-2(a)的边缘,程序清单见附录,检测结果如图4-5所示。

图4-5 Canny算子边缘检测

对比前面提到的梯度相关算法(如LoG和Canny),通过图4-2(b)、4-3、4-4及4-5的数据分析可知,Canny算法在边缘检测方面表现最为理想。

4.3灰度阈值分割

4.3.1阈值分割介绍

a.阈值化分割原则

在图像分割领域中,基于阈值化的分割算法是最常用的方法之一。简单来说,在处理灰度图像时,在进行阈值分割之前首先要设定一个位于整个图像灰度范围内的基准数值(通常称为阈值)。随后将每个像素的亮度水平与其设定的标准亮度进行比较,并依据比较结果将这些像素分为两类:一类是亮度高于标准的部分;另一类则是亮度低于或等于标准的部分(其中等于标准的部分可以根据具体需求归入任一类)。这种基于亮度标准对所有像素进行分类处理的方式实现了区域划分的目标。由此可见,在这一过程中包含两个主要步骤:首先是确定合适的对比基准并完成初步分类;其次是根据实际需求对初步分类结果进行优化和调整以完成最终的区域划分任务

  1. 设定该图像的分割界限值;
  2. 对于该图像中的每个像素点而言,在将其灰度值与其对应的分割阈值进行对比后即可实现图像像素划分。

在图像处理流程中选择合适的分水岭参数是一个关键步骤,在这一过程中确定合适的分水岭参数标准至关重要,在这一过程中选择合适的分水岭参数标准至关重要

在利用取阈值法进行灰度图像分割时通常基于对图像灰度分布的假设或者说是建立在特定的图像模型基础之上。最常采用的模型如下所述:假设目标区域与背景区域均为具有单峰灰度分布的空间体,在相邻像素位于目标或背景内部时其灰度值具有较高的相关性;而位于目标与背景交界处两侧的像素其灰度值差异显著。若一幅图像满足上述条件则其直方图大致可视为由分别对应于目标与背景两个单峰直方图的混合结果。如果这两个分步各自所对应的像素数量接近且均值之间的差距足够大同时两者的均方差也较小那么整体上呈现出明显的双峰特征类似地当一个图像包含多个具有单峰灰度分布的目标类别时其直方图可能会显示出较为明显的多峰特性对于此类图像通常采用取阈值法以实现较好的分割效果

将图像中的不同灰度像素划分为两类,则需设定相应的判别标准。
若要将图像中的不同灰度像素划分为多个类别,则需选定一系列判别标准。
单一判别标准的应用被称为单阈值分割方法;而采用多重判别标准则构成多阈值分割方法。
值得注意的是;单 thresholds segmentation 实际上是多 thresholds segmentation 的一种特殊情况;许多基于单一判别标准的方法均可推广应用于多 thresholds 分割过程。
另一方面;有时也可以通过将一个多 thresholds segmentation 问题分解为一系列单独应用单一判别标准的问题来实现目标。
无论采用何种策略来确定分类依据;原始图像 f(x,y) 经过基于单一 threshold T 的分割处理后;所得结果定义如下:

(4-16)

这样得到的

是一幅二值图像。

在一般的多阈值情况下,取阈值分割后的图像可表示为:

(4-17)

其中

是一系列分割阈值,k表示赋予分割后图像各区域不同的标号。

需要强调的是,在无论是单阈值分割还是多阈值分割的情况下,在分割结果中都可能出现不同区域具有相同的标记或数值的情况。这是因为采用基于亮度进行分割的方法时,并未考虑到相邻像素在图像空间中的位置关系。因此,在基于亮度划分到同一类别中的像素可能实际上属于图像中不连续且分离的区域部分。这时通常需要结合一些关于场景先验知识的信息来进一步明确目标的具体范围和界限

b.阈值分割算法分类

现有的阈值化分割算法种类繁多,在文档图像处理中采用不同类型的分类策略

探讨分割过程是否依赖于人工干预, 可将其划分为交互式与自动化两种类型;
基于阈值的作用范围, 可将图像分割细分为全局型与局部型;
在阈值选取方法上, 根据所采用的方法不同, 可将其分为上下文相关型和上下文无关型两类; 其中, 上下文相关型主要依据的是灰度分布的一阶统计特性, 而上下文无关型则主要基于灰度分布的二阶统计特性;
从处理策略的角度来看, 图像分割算法可大致分为迭代型与非迭代型两大类;
依据是否利用训练像素集来估计目标或背景特性参数的不同, 图像分割方法也可划分为有监督学习类型和无监督学习类型。

在前面有关阈值化原理的讨论中已有论述表明如何选择适合分割的阈值化算法的问题。从而可以根据不同类型的阈值选择方法进行算法分类。通常采用以下形式表示:T = \{t_i | t_i \geq 0, i=1,2,\dots,n\}

(4-18)

其中

代表在像素点

处的灰度值,

代表在该点邻域的某种局部性质。即阈值T在一般情况下可以是(

),

的函数。借助上式,可将取阈值分割方法分成如下3类,相应的阈值分别称为:

  1. 基于各像素值的阈值 阈值仅根据

来选取,所得到的阈值仅与全图各像素的本身性质(像素值)有关;

  1. 基于区域性质的阈值 阈值是根据

所选的阈值范围与该区域的空间特性(包括区域内各像素的取值、各像素之间的关系以及它们的空间分布情况等)密切相关;

  1. 基于坐标位置的阈值 阈值进一步(除根据

来选取外)还与

有关,即阈值要考虑位置(

),来确定,则所得的阈值是与像素空间坐标有关的。

确定第一类阈值的技术有时被称作点相关技术;而确定第二类Thresholds的技术也可称为区域相关技术;确定第三类Thresholds的技术也可称为动态Thresholds技术。前两类通常也被视为全局或固定Thresholds;因为此时所采用的Thresholds适用于整个图像;或者对每个像素应用相同的分割标准。从另一个角度看,局部化的分割策略可被视为全局策略的一种特例。

这种方法在分类取阈值分割方案时展现出通用性。近年来出现了多种利用视觉神经、神经网络以及模糊数学等技术手段进行取阈值分割的应用方案。尽管如此仍可将其归类为上述三种主要类型之一。

4.3.2全局阈值

对于灰度图像而言,在基于各像素值设定阈值时仅仅考虑了各个像素自身的亮度数值。由此可见所述算法通常较为简便;然而该方法在抗噪声方面表现不够理想。其中所定下的阈值(在多阈值分割中视为一个序列)被施加在整个图像的所有像素上。因此对于具有明暗层次过渡显著的目标与背景而言该方法的效果将大打折扣甚至无法正常运行。

图像的灰度分布表征了其各像素亮度信息的统计特性。基于直方图的方法是获取阈值参数的主要手段之一。对于双峰分布的情况,在确定两个峰值之间最低亮度点作为阈值能够有效地区分目标与背景;这一策略在多峰分布中同样适用。至于如何选择合适的谷点位置,则有多种不同的方法可供采用;本节将重点介绍几种具有代表性的技术方案。

a.极小值点阈值

将图像灰度分布的累积曲线视为整体趋势的表现形式,则进一步确定直方图峰值的位置通常采用寻找曲线上最低点的技术。其中一种常用的方法是

代表直方图,那么极小值点应同时满足:

(4-19)

和这些极小值点对应的灰度值就可用作分割阈值。

实际图像的直方图因为存在图像噪声等因素而导致出现频繁起伏的现象。这些起伏可能导致在使用公式(4-19)时可能出现将假性谷当作真实极小值的情况。一种有效的方法是,在进行极小值检测之前先对数据进行平滑处理以减少这种误判的可能性。

b.最优阈值

有时由于图像中目标与背景的灰度分布会出现部分重叠,在这种情况下使用单一全局阈值进行分割往往会带来一定的误判问题。为了尽量降低误判的可能性——即既不把目标区域误分为背景区域也不把背景区域误分为目标区域——寻找最佳分割点是一种常用的技术手段。最佳分割点指的是在所有可能的分割点中能够使误判概率最低的那个点。根据概率统计的方法可以看出:图像的直方图实际上是对像素灰度值概率分布密度函数的一种近似表示;假设一幅图像仅包含两个主要的灰度范围(对应目标区域和背景区域)那么其直方图反映了这两个类别各自的单峰分布叠加情况;如果已知各分量的概率密度函数形式则可以通过数学方法求解出最佳分离线进而实现精确分类。

设有这样一幅混有加性高斯噪声的图像,背景和目标的概率密度分别是

,整幅图像的混合概率密度:

(4-20)

其中

分别是 背景和目标区域的平均灰度值,

分别是关于均值的均方差,

分别是北京和目标区域灰度值的先验概率。根据概率定义有

=1, 因此, 混合概率密度公式(4-20)中仅包含5个未知参数. 如果能够求取这些参数, 就有可能确定整个混合概率密度.

图4-6 最优阈值选取示意图

如图4-6所示。假设

应设定一个临界值T以便于将灰度强度低于T的像素归类为背景区域与将高于T的像素归类为目标区域

(4-21)

(4-22)

总的误差概率为:

(4-23)

为求得使该误差最小的阈值可将

对T求导并令导数为零,这样得到:

(4-24)

将这个结果用于高斯密度(即将式(4-20)代入)可解得:

(4-25)

=

=

时:

(4-26)

若先验概率相等,即

,则:

(4-27)

这表示如果图像灰度值从正态分布时,最佳阈值可按上式求得。

c.迭代阈值分割

该阈值可通过迭代方法计算获得,在初始化阶段,则选取图像灰度范围的中值作为初始阈值设定

,然后按下式迭代:

(4-28)

式中

是灰度为k值的像素个数,共有L个灰度级。迭代一直进行到

结束,取结束时的

为阈值。

使用阈值分割方法对图像4-8(a)进行处理。其中的灰度直方图及其阈值分割结果分别如图4-8(b)和(c)所示。完整的程序清单可参考附录部分

(a)原始图像 (b)原始图像的灰度直方图

(c)阈值分割结果

图4-8 灰度阈值分割效果图

4.3.3动态阈值

当一幅图像包含以下几种情况时:存在阴影区域、光照分布不均匀、整体对比度呈现不均匀性以及偶尔出现突发噪声干扰,并且背景亮度发生变化等情况下,则仅采用一个固定全局阈值进行整体二值化分割可能会导致分割效果受限。一种有效的方法是根据图像中每个点的位置设置不同的阈值参数(即空间位置相关的阈值函数)来实现局部化的分割处理。这种根据位置变化而调整的分界线技术被称为动态阈值法(亦称变化阈值法或自适应阈值法)。尽管这类算法通常在时间和空间复杂度上具有较高的要求,但其抗噪声能力较强,并且能够较好地处理那些全局二值化方法难以处理的情况(例如目标与背景之间灰度分布存在明显过渡变化的图像)。这些算法在文档二值化处理中表现出较好的适用效果

基于动态度量的方法相对较为简单。具体而言,对于每一个像素,我们首先确定以其为中心的一个局部区域,然后通过计算该区域的最大和最小灰度值得到这一区域的最大变化范围.随后,我们将这些极值求其算术平均作为该像素点对应的阈值.进一步分析表明,在这种情况下图像像素灰度与阈值之间的差异呈现出类似二阶导数的行为特征.因此,在过零点处进行分割能够有效地实现图像二元化处理的结果.下面再介绍另外的两个办法.

a.阈值插值

这种变化阈值技术可被视为全局固定阈值技术的一种局部实现形式。首先将整个待处理图象划分为若干个互相关联的子图象组,在此过程中这些子图象组之间可能存在重叠或仅相邻的情况。当子图象规模较小时,在阴影区域或对比度空间变化等方面所导致的问题也会相对较小。随后可为每个子图象确定一个判别标准,在这一过程中可以选择任意一种固定的判别方法进行处理。通过这些子图象所得到的插值计算结果即可确定出用于分割每个像素点所需的统一判别标准。这里对应每个像素点的判别标准合起来组成图象(幅度轴)上连续分布的一个空间形态——我们称之为‘判别曲面’或者‘判别标准曲面’

将整个图像分割成一系列相邻的部分,这些部分彼此之间有50% 的重叠.
计算每个子图像的直方图.
检测各个子图像的直方图是否为双峰分布. 如果是,则应用上述介绍的方法来确定各子图像 的阈值;否则不进行处理.
基于那些双峰分布 的子 图像所获得 的 阈 值信息,在基 础上 通过 插 值 方法 计算 出 所 有 子 图像 的 阈 值.
基于各 子 图像 已 确 定 的 所 有像素 阈 值,在基 础上 通 过 插 值 方法 得 到 整个 图像 区域 所 有像素 对应 的 统一 阈 值,并 最终完 成 图像 分割.

b.水线阈值算法

watersheds (also referred to as basins or catchments), denoted as Watershed) thresholding algorithm does not require segmentation at the optimal threshold, whereas it is a special adaptive iterative threshold segmentation algorithm. To illustrate the principles of the watershed thresholding algorithm, Figure 4-6 is utilized.

图4-9中给出的是一幅图像中的一个剖面,其中灰度较高的两个目标从背景

中取出来并相互分开。先用一个较大的阈值

对图像进行分割时能够实现将图中两个目标与背景区分开来但这种分割后的间隙过大如果后续逐渐减小阈值则目标的边界会随之向彼此扩展最终两者会相遇但为了避免合并它们相遇前所保持的最后一组像素就确定了两者间的最终边界这一过程在降低到背景灰度之前就可以终止

实际中水线算法通常情况下会采用一个较高但依然能够将各个目标分离开来的初步阈值来进行分割操作。随后,在逐渐降低至最佳阈值附近的过程中,则不会再对已经被分离开的目标进行不必要的合并处理。通过这种方法便能够有效避免全局阈值方法在目标彼此接近时所导致的目标合并问题出现。其中,在这一过程中的初始阈值选择至关重要:只要选择合适的初始阈值范围,并且严格按照后续步骤执行操作,则最终就能确保分割结果的准确性

进而无法捕获低反差的目标,在随后逐步降低阈值的过程中会将其与高反差的目标合并;相反地,在初始阈值设置过低的情况下(如图4-9所示)

如上所述),因此,在初始阶段的目标就会被整合在一起。此外,在最终阈值的选择上也至关重要,并决定了最终边界与目标之间的匹配程度

MATLAB中用函数watershed找到流域,调用格式L=watershed(A)。

阈值分割的方法多种多样,在每一种方法中都具有其独特的特点以及对应的应用场景。在实际应用过程中,阈值分割往往会与其他技术相结合使用以达到理想或满意的效果

采用水线阈值法对图像4-10进行处理。其高帽变换的输出结果如同步显示在图4-10(b)中。其低帽变换的输出效果如同步展示在图4-10(c)中。通过将高帽与低帽变换结果相减得到的效果如同步呈现于图4-10(d)中。经过阈值分割处理后的效果显示在图4-10(e)中。最后采用水线阈值方法完成图像分割效果体现在图4-10(f)中。程序清单见附录

(a)原始图像 (b)高帽变换图像

(c)低帽变换图像 (d)高帽与低帽相减后的图像

(e)进一步增强图像 (f)水线阈值分割图像

图4-10 水线阈值法分割

4.4区域分割

4.4.1区域生长的基本原理、步骤及流程图

区域生长的核心概念在于通过收集具有相似特性的像素来形成特定区域。在分割过程中会先为每个目标区域选定一个起始点——即种子像素,并将其作为起始点展开搜索和扩张过程。随后,在周围的邻域内寻找那些具有相同或相近特性的pixels,并将其纳入seed 像素所在的区域内。不断重复这一过程,并以新加入的pixels 作为新的seed pixels 继续扩展……直至不再有符合条件的新pixel 可被纳入为止。

如图4-8所示,在已知种子点的基础上展开的区域生长方法可作如下说明:首先选取两个不同亮度的方块作为初始种子像素。随后根据设定的标准进行扩展操作。具体而言,在每次迭代中系统会评估当前考察像素与其所属种子群组之间的灰度差异程度。若该差异绝对值低于预先设定好的阈值,则将该像素纳入相应群组中。通过这一过程不断更新群组边界直至满足收敛条件。在实际应用中发现当取T=3时,在图4-12(b)中展示了相应的区域分割效果;而当取T=1时如图4-12(c),由于判别标准过于宽松导致某些边缘像素无法明确归属;再如取T=6时则如图4-12(d)整个图像被划分为一个单一区域。由此可见该阈值的选择对最终分割效果具有显著影响

从上面的示例可知,在实际因果能够区域生长方法时需要解决3个问题:

  • 采用一种能够准确反映目标区域特征的种子像素选取策略;
  • 建立一种在图像生长过程中能够合理纳入邻近像素进入的目标准则;
  • 制定明确的图像生长终止条件与终止规则。

第一个问题通常可依据图像特征来选取种子像素。例如,在红外图像检测技术中,一般情况下,目标具有较高的辐射值,因此常选取最亮区域的像素作为初始种群点。当缺乏图像先验信息时,则可通过设定合适的生长标准来计算相关 pixels 的初始参数设置值。若聚类分析结果明确,则可选用聚类中心作为初始 seed点进行后续运算。

第二个问题的解决不仅受具体问题特征的影响,并与图像的数据类型密切相关。对于RGB彩色图像而言,在应用单一色调标准时可能会导致分割效果出现问题。此外,在分析像素间的连通性时还需注意其可能产生的无意义分割情况出现的可能性。

通常情况下,在不再存在满足增长标准所需的关键像素时,增长过程会自然终止。然而目前广泛采用基于灰度值、纹理特征以及颜色信息的方法主要局限于图像局部特性分析,并未充分考虑到增长过程的历史信息。为了提高区域增长策略的有效性,在选择新的候选区域时应综合考量其与整体尺寸、形状特征及其对应目标类型之间的关系。当上述情况出现时,则必须建立相应的数学模型并结合预先获取的知识来进行分割处理。

4.4.2生长准则和过程

区域生长的一个核心在于选择合适的增殖或相似标准。大多数区域增长标准都基于图像的局部特征,并且这些标准可以根据不同的原则来设定。采用不同的标准将会对整个过程的发展产生显著影响。下面我们将介绍三种基本的增长标准及其应用方法。

a.灰度差准则

区域增长法采用像素作为基本单元对图像进行处理,在基于灰度差的变化下展开工作。该方法具体包括以下内容:

  1. 对图像进行逐行遍历以识别尚未被归类的像素点;
  2. 围绕该中心像素除考察其直接相邻区域外还需逐一比对相邻区域的所有像素除灰度差异低于预设阈值时才予以合并处理;
  3. 重新以合并后的结果作为新的中心点重新进入第二步操作直至无法再扩大扩展范围;
  4. 循环回到第一步并持续遍历图像直至所有可归类像素都被识别完毕。

通过上述方法获得的结果对区域生长起点的选择具有高度依赖性。为了消除这一问题的影响,请参考下面的改进方案:

  1. 令灰度差异阈值设为零,并通过所描述的方法实现区域扩展;通过该策略可将具有相同灰度值的像素纳入同一区域。
  2. 计算所有相邻区域之间的平均灰度差异,并将具有最小灰度差异的相邻区域进行整合;此过程有助于优化整体图像特征。
  3. 确定终止条件后,在每次迭代过程中重复执行步骤二的操作;直至满足预设终止条件为止。

当图像中存在缓慢变化的区域时

对一个含N个像素的区域R,其均值为:

(4-29)

对像素是否合并的比较测试表示为:

(4-30)

其中T为给定的阈值。

在区域生长的过程中遵循以下原则:首先要求图像中的同一区域具有较小的灰度值差异;其次不同区域之间的灰度差异较大;针对这两种情况分别进行分析:

假设所选区域具有均匀特性,则其灰度值可视为均值m与零均值高斯噪声叠加的结果;其中,在应用公式(4-30)评估某像素时,则条件不成立的概率即为此处关注的重点。

(4-31)

这就是误差概率函数,在设置T为3倍的方差时(即σ),误判概率范围确定在1%至99.7%之间(即约1-σ至约3σ)。这表明,在考虑灰度均值的情况下(即基于平均亮度),区域内的灰度变化幅度应尽可能小(即保持稳定)。

设定该区域为非均匀分布,并由两个不同目标的图像像素组成。这两个像素群在R中的各自所占比例分别为

,灰度值分别为

,则区域均值为

。对灰度值为m的像素,它与区域均值的差为:

(4-32)

根据式(4-30),可知正确的判决概率为:

(4-33)

这表明,当考虑灰度均值时,不同部分像素间的灰度差距离应尽量大。

b.灰度分布统计准则

在当前阶段, 考虑基于灰度分布相似性的准则来确定区域间的合并关系, 具体过程如下:

将图像分割为非重叠的小区域;随后比较邻接区域间的累积灰度直方图,并依据它们灰度分布的相似性来进行区域合并;最后设定终止条件后,在步骤(2)的基础上反复执行操作直至满足条件。

这里对灰度分布的相似性常用两种方法检测(设

分别为两邻接区域的累积灰度直方图):

Kolmogorov—Smirnov检测

(4-34)

Smoothed—Difference检测

(4-35)

如果检测结果小于给定的阈值,即将两区域合并。

通过灰度分布相似判别准则合并法实现区域的具体实施步骤与灰度差别准则的合并法相类似。该方法生成的结果与其所涉及的小微区域尺寸以及阈值选取有着密切的关系。通常情况下, 微小区域内尺寸过大将会导致因过度融合而未能正确分割出各个独立区域; 小尺寸可能导致融合不足从而分割不正确。具体来说, 原始图像生成状态的不同以及整体图像复杂性的高低都会对参数的选择产生重大影响.The settings for q and T typically derive from the specific outcomes observed under given conditions.

c.区域形状准则

在基于区域整合时也可以参考目标形态的检测结果。主要有两种途径:一种是通过分析手段识别关键特征;另一种则是结合几何模型进行优化。

  1. 把图像分割成灰度固定的区域,设两邻接区域的周长分别为

,把两区域共同边界线两侧灰度差小于给定值的那不凡长度设为L,如果(

为预定阈值):

(4-36)

则合并两区域;

将图像划分为具有固定灰度的区域,并定义相邻区域之间的公共边界长度为B;同时,在满足相邻区域内两侧灰度差不超过设定阈值的前提下,则将相邻区域内满足条件的部分定义为L;如果(

为预定阈值)

(4-37)

则合并两区域。

上述两种方法的区别在于:第一种方法将两邻接区域的共同边界上对比度较低的部分与所占整个区域边界份额较大的部分进行合并;第二种方法则将两邻接区域的共同边界上对比度较低的部分与所占整个区域边界份额较多的部分进行合并。

4.4.3分裂合并

在4.4.2节中描述的区域生长方法是从小规模种子像素逐步吸收新像素最终形成完整区域。另外一种分割思路是将整个图像持续分割以获得各个细分区域,在实际应用中通常会先将图像划分为若干互不重叠的部分然后根据需要对这些部分进行合并或进一步划分以满足分割条件。

在这一类方法中主要采用的方式是四叉树分解法假设一个场景下我们设定变量D来表示待处理的数据集假设D是一个二维数组假设D中的每个元素都是一个像素点那么我们需要对这个数据集进行处理以达到某种目标

,并且始终使

。换句话说,如果

,那么就将图像分成4等分。如果

,那么就将R分成4等分。如此类推,直到

为单个像素。

如果仅限于只能执行分裂操作,则可能出现某些相邻区域虽然具备相同的属性但却未能完成统一合成的情况。为了使这一过程能够顺利进行,在每次分割之后允许继续执行分割或合并操作。此处规定仅在那些相邻且新合成区域满足逻辑谓词P的情形下才允许进行合并。即若能符合这一条件,则可实现预期目标;否则则需采取相应措施避免冲突发生。

,则将

合并起来。

总结前面所述的基本分裂合并算法步骤如下:

  1. 对任一个区域,如果

就将其分裂成不重叠的4等分;

  1. 对相邻的两个区域

它们也可以大小不同,即不在同一层,如果条件

满足,将它们合并起来;

  1. 如果进一步的分裂合并都不可能了,则结束。

在MATLAB软件中可以通过调用图像处理工具中的qtdecomp函数来完成四叉树分解这一过程。该函数首先将图像划分为大小相等的正方形区域然后对每个区域进行测试以判断其是否符合标准特征对于不符合标准的标准则对其进行进一步细分此过程持续直至所有区域均满足标准特征

qtdecomp的基本调用方法如下:

s=qtdecomp(I,Threshold,[MinDim MaxDim])

设I为输入图像。Threshold为一个可选参数。若某子区域内最大像素亮度与最小亮度之差超过Threshold所设定的阈值,则继续进行分解;否则则停止并返回。[MinDim, MaxDim]同样也是一个可选参数,在此过程中用于指定最终分解所得子区域尺寸。返回结果S是一个稀疏矩阵,在该矩阵中非零元素的位置对应于块的左上角位置,并且每个非零元素数值代表相应的块尺寸大小。

四叉树分解的程序清单与实验结果见附录。

第五章 总结

本文主要基于Matlab软件平台阐述了边缘检测、灰度阈值检测以及区域分割方法,并通过对多种分割技术进行了详细比较与性能评估,并对当前存在的若干技术难点进行了深入探讨

5.1对于图像边缘检测的分析

检测阶跃边缘的核心思路在于识别图像中局部最大梯度幅值的像素点。主要关注于开发能够精确逼近实际图像梯度的数字方法。实际图像经历了摄像机光学系统以及电路系统的协同作用(带宽限制),导致其边缘不够陡峭明显。此外该过程还受到摄像机内部产生的噪声以及场景中非关键细节的影响。在消除噪声方面与精确定位之间存在权衡:若采用平滑化处理以去除噪声则会降低对边缘定位精度的需求;反之若增强对边缘本身的敏感性则会提高对噪声数据的误判风险。通过对各算子(Roberts、Sobel、Prewitt、拉普拉斯、LoG、坎尼)在分割步骤、分割方式及准则上的对比可以看出:其中Canny算子依据多准则优化后表现最优。这种算法不仅能够适应不同画质的画面还能精准提取所需细节从而取得理想效果

5.2对于图像阈值分割的分析

该算法在图像分割领域具有广泛的使用基础,在实际应用中表现最为突出的一类方法即为基于亮度门槛的技术体系

5.3对于图像区域分割的分析

基于区域的增长策略是一种有效的图像分割方法。其基本思想在于通过聚合具有相似特性的像素来形成统一的区域。具体而言,在每个目标区域内选取一个代表性的初始点(称为种子),然后逐步扩展这个初始点周围的相邻象素到同一区域内。这一过程持续进行直至不再存在可满足条件并可纳入现有区域的新象素为止。然而,在实际应用中仍面临诸多挑战:如何合理选取能够充分代表目标区域能够提供可靠分割依据的关键初始点;如何建立科学合理的判别标准以确保相邻象素能顺利被纳入当前分区;以及如何制定明确终止条件确保算法运行效率等问题尚待进一步探索与优化。相比之下另一种常见的分割策略则基于不断细分和重新组合的方法

研究上述图像分割方法后可知各法优劣各有不同。(1)阈值法虽简便却效果欠佳;(2)边缘检测仅利用局域信息导致分割区域内部颜色不易统一,并且难以形成连续闭合的边界;(3)区域增长算法所得边界常呈不规则形状伴随产生微小孔洞;(4)迭代像素聚类计算负担过重;(5)全局优化途径难以寻找到最佳及次佳解。我们可根据实际需求在这些算法中选择合适之方案以获得理想效果图

除了以下之外还存在其他多种图像分割的方法例如彩色分割基于数学形态学的图像分割技术和借助统计模式识别的方法这些方案各有其独特的优势与不足并为此类问题的研究提供了更多的可能性

5.4改进意见

为了以获得更优更快的分割效果, 可以采用下面所述的具体方法: 首先, 均匀分布地初始化设置若干个区域生长种子, 同时启动其生长过程; 在两个区域相互作用时展开竞争分析; 最终导致坏种子所占据的区域逐渐被抑制并最终消失

具体做法包括依据需求执行边缘检测,并将图像划分为多个独立的边界点集合。随后使这些边界点集合通过扩展和相互连接的方式逐步形成闭合的边界结构。接着在此过程中引入竞争机制使得相邻区域之间产生相互作用最终生成较大的统一区域从而实现图像分割的目的。

具体操作步骤:

  1. 边缘点识别:在此处采用Canny算子作为边缘检测工具,在其三个核心准则下既能有效抑制噪声干扰又能精确定位出各个边缘像素点的具体位置。
  2. 边缘线生成:在计算梯度极值时选择较高的梯度阈值能够捕获出关键的边沿像素点,在此过程中能够剔除掉一些孤立的小范围边沿素集合并使连接成较短的一系列边沿线段随后这些线段会向两端延伸直至与其他边界像素或已识别边沿线接触为止这种机制可以通过数学形态学的方法实现。
  3. 大范围目标确定:通过设定一个基准间距采用栅格扫描的方法对所形成的边沿结构进行遍历当所选初始种子间距超过该基准间距时则将其归类为同一目标区域这种策略能够在较为宽泛的空间范围内实现有效的目标定位。

按照下面所述的步骤进行操作的话,在理论上能够实现较为理想的分割效果。然而,在实际应用过程中也存在着较多的问题,在这种情况下建议我们一方面在实践中不断优化调整方法;另一方面在不断的尝试中寻求突破。

参考文献

[1]边肇祺等.模式识别[M].清华大学出版社,1988

[2]王爱民,沈兰荪.图像分割研究综述.测控技术[J],2000

[3] 岳海萍. 基于Matlab平台的数字图像边缘检测技术[J]. 辽阳石油化工高等专科学报, 2002

[4]赵荣椿,迟耀斌,朱重光.图像分割技术进展[J].中国体视学与图像分析.

1998

[5]邹益民.MATLAB与C语言的混合编程.计算机应用,2000

[6]张军平,王珏.主曲线研究综述[J].计算机学报,2003,26(2):129~146.

[7] Steve Rimmer.Windows图像处理实用技术和范例[M].学苑出版社,1994

[8] Acharya RS.et al. Proc of SPIE.1991,1652:50~61

[9] Boire JY.et al. Proc Ann Int Conf IEEE Eng Med Biol Soc. 1990:421~422

The work by Dougherty ER, titled 'Introduction to Mathematical Morphology,' was published by SPIE Optical Engineering Press in 1992.

[11] Higgins WE.et al. IEEE Transactions on Medical Imaging.1990.19(8):384~395

[12]M.liang,Z.K.Sun.A neural network model for image segmentation.Swizerland

[13] S.D.Yanowitz,A.M.Bruckstein. Anewmethodforimage segmentation.

Computer Vision Vision.Graphics,and Image Processing,1989

[14]Skolnik. Mathematical Morphology.CVGIP,1986,35:281~282

致 谢

附 录

程序清单:

1.用Prewitt算子检测边缘:

I=imread('sunset1.bmp');

BW1=edge(I,'prewitt',0.04); % 0.04为梯度阈值

figure(1);

imshow(I);

figure(2);

imshow(BW1);

2.用不同σ值的LoG算子检测图像的边缘

I=imread('pic1.bmp');

BW1=edge(I,'log',0.003,2); % σ=2

imshow(BW1);

title('σ=2的LoG算子检测的边缘')

BW1=edge(I,'log',0.003,3); % σ=3

figure,imshow(BW1);

title('σ=3的LoG算子检测的边缘')

3.用Canny算子检测图像的边缘

I=imread('sunset1.bmp');

BW1=edge(I,'canny',0.2);

figure,imshow(BW1);

title('canny算子边缘检测');

4. 阈值分割

I=imread('pic1.bmp');

imhist(I); %观察灰度直方图,灰度140处有谷,确定阈值T=140

I1=im2bw(I,140/255); % im2bw函数需要将灰度值转换到[0,1]范围内

figure,imshow(I1);

5. 水线阈值法分割图像

afm= imread (’cell.tif’);

figure, imshow(afm);

se=strel (’disk’,15);
Itop=imtophat(afm,se);figure,imshow(Itop,[ ]);
Ibot=imbothat(afm,se);figure,imshow(Ibot,[ ]);
Ienhance=imsubtract(imadd(Itop,afm),Ibot) ;

figure,imshow(Ien2hance);
Iec=imcomplement(Ienhance);

Iimpose=imimposemin(Iec,Iemin) ;

wat=watershed(Iimpose);

figure,imshow(wat) ;

6.对下列矩阵进行四叉树分解程序及结果

I=[1 1 1 1 2 3 6 6

1 1 2 1 4 5 6 8

1 1 1 1 10 15 7 7

1 1 1 1 20 25 7 7

20 22 20 22 1 2 3 4

20 22 22 20 5 6 7 8

20 22 20 20 9 10 11 12

22 22 20 20 13 14 15 16];

S=qtdecomp(I,5);

full(S)

ans =

4 0 0 0 2 0 2 0

0 0 0 0 0 0 0 0

0 0 0 0 1 1 2 0

0 0 0 0 1 1 0 0

4 0 0 0 2 0 2 0

0 0 0 0 0 0 0 0

0 0 0 0 2 0 2 0

0 0 0 0 0 0 0 0

全部评论 (0)

还没有任何评论哟~