Advertisement

【论文阅读】SVM for classification in remote sensing

阅读量:

遥感怎么分类的

题目:Support vector machines for classification in remote sensing

作者:M. PAL,P. M. MATHER 英国诺丁汉大学地理学院

一、综述

文章主要致力于对比分析支持向量机(SVM)、最大似然法(ML)以及人工神经网络(ANN)在分类任务中的准确性。研究采用Landsat-7 ETM+多光谱遥感信息以及DAIS高光谱遥感数据集作为输入资料,并将实验区域设定在英格兰东部和西班牙中部。

1995年Vapnik提出了一种支持向量机(SVM),作为替代于神经网络用于分类的任务,并被后续研究者应用于遥感数据的分类问题中;它基于统计学习理论的核心原理下确定了一个用于区分不同类别之间的最优分界面;例如,在处理线性可分的二元分类问题时;它会从众多可能的选择中寻找泛化性能最佳的那个决策面;最终使得两类之间的间隔最大化;这一过程通常通过标准二次规划优化技术实现;而这些距离最近的数据样本则被称为支持向量;它们的数量相对较小

如果二元分类问题无法用线性边界解决,则支持向量机(SVM)会试图寻找两个目标之间的平衡点:一方面希望尽可能扩大空区域;另一方面则努力减少误判情况。用户可以通过引入一个调节参数来权衡空区间的大小与误分率的高低。支持向量机不仅能够处理线性可分的问题,在非线性数据上也能表现出色。Boser在1992年的研究中提出了一种方法:通过应用核函数将输入样本映射至更高维的空间,并清晰阐述了基于这一变换后的线性分类器的工作原理。Vapink在1995年对此问题进行了更深入的探讨。

对于多分类问题(涉及N个类别),支持向量机(SVM)需要确定N个分离超平面,并建立相应的二次规划(QP)优化子问题。每个QP将一个特定类别与其他所有类别分开,并将此过程称为“one versus all”策略。或者从所有两两组合的训练数据中训练二元分类器:每个二元分类器只基于一对类别进行训练,并生成C(n,2) = n(n-1)/2 个二元分类器。将这些二元分类器应用于测试样本向量,并统计每类获得的票数;最多的票数对应的类别即为最终预测结果。“

二、研究内容与方法

基于2000年6月19日的数据集

RHUL_SVM既可以采用“one against the rest”策略又可采用“one against one”策略来进行分类比较。LIBSVM仅支持“one against one”的方法。这些基于SVM的分类结果将通过对比分析与ML以及ANN方法进行对比。

从两个区域中进行数据采样,并将采集到的像素样本划分为两组进行分析处理:其中第一组来自ETM+平台获取的高光谱遥感数据,在该区域内构建了面积为2700平方公里的训练区和面积为2307平方公里的测试区;第二组则基于高光谱成像技术获取的空间分布特征,在该区域内划分了面积为800平方公里的训练区以及面积为3800平方公里的测试区范围。在进行ANN模型训练过程中,则采用每类样本随机选取60个像素作为验证用样例来进行模型性能评估

三、实验结果及分析

SVM中采用核可扩展容量来解决非线性问题。至改论文发表时为止,现有文献尚未明确提出关于核大小及参数选取的指导原则,因此只能通过多组实验进行验证,本文通过选取5个不同核、不同参数组合测试模型分类准确率。

达到了最高的准确率水平。表1详细列出了训练次数与对应的准确率数据,并通过图表形式直观呈现了其变化趋势。表2则清晰展示了机器学习(ML)与人工神经网络(ANN)各自的分类性能对比结果。

实验第二部分:基于高光谱数据(包含大量特征)对SVM、机器学习模型及人工神经网络进行了分析。随着维度的增加(原因在于),计算概率所需的统计参数估测可靠性下降了,在Hughes(1968)的研究下,这进一步降低了机器学习模型的准确率。然而,在这种情况下对人工神经网络的影响较小。DAIS系统共有72个波段,在受限于其中7个波段存在严重异常的情况下,我们选择了使用65个有效的波段进行分析。初始值设定为5,并以5为间隔进行循环设置。以下是实验结果:

四、感悟

全部评论 (0)

还没有任何评论哟~