《遥感图像分类方法的研究与精度评定.doc》由会员分享,可在线阅读,更多相关《遥感图像分类方法的研究与精度评定.doc(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、遥感图像分类方法的研究与精度评定目 录摘 要IABSTRACTII1. 绪论11.1 选题背景11.2 我国遥感技术分类现状22 遥感图像32.1 遥感概念32.2 遥感图像的几何处理32.2.1 遥感图像的几何变形42.2.2 遥感图像增强52.3 特征提取和特征选择83. 遥感图像分类103.1 遥感图像分类原理103.2 监督分类113.2.1 监督分类的步骤113.2.2 最大似然分类法123.2.3 平行多面体分类方法133.2.4 最小距离分类方法143.3 非监督分类153.3.1 K-均值聚类法153.3.2 ISODATA 算法聚类分析163.3.3 平行管道法聚类分析173
2、.4 计算机自动分类的新方法173.4.1 神经网络分类法183.4.2 模糊分类法183.4.3 专家系统分类法193.4.4 支持向量机SVM分类法203.4.5 决策树分类法204 精度评定215 结束语23致 谢24参考文献25遥感图像分类方法的研究及精度评定摘 要随着科学技术的发展,航空遥感图片和卫星遥感图像分辨率不断提高,在从不同角度认识宇宙世界的方式中,遥感已然占据了不可撼动的位置。目前,遥感图像在空间数据资源采集方面起着越来越重要的作用。本文对遥感图象分类的研究背景进行了回顾,对遥感基本原理和进行图像预处理时的一些方法进行了重点介绍,简要概述了一些概念和原理,对较早出现的的遥感
3、分类方法(监督分类和非监督分类)进行了分析,展望了近年来出现的一些较新的计算机分类方法,包括人工神经网络和模糊分类等,然后比较分析了各种方法的原理,算法及各自的优缺点。最后,对距离分类方法及遥感图像分类的精度评定做了详细阐述。虽然遥感技术在社会发展的很多方面有着广泛应用,但是遥感图像分类在其中占据着重要的位置。在遥感图像分类中,遥感数据是否能够使用很大程度上取决于分类的精度。传统的监督分类和非监督分类方法也是各有利弊,我们只有通过不断的实践学习,综合应用各种分类方法,充分发挥它们的长处与不足,这样分类的准确率与精度才能不断提高。关键词: 遥感 图像分类 精度评定RESEARCH AND ACC
4、URACY EVALUATIONOF IMAGE CLASSIFICATION ABSTRACTWith the development of satellite remote sensing images and the improvement of aerial remote sensing image resolution, remote sensing has become a new method and a new mean that human understand universe from multidimensional and macro perspective. At
5、present, the remote sensing image plays a more and more important role in the spatial data resource acquisition. This paper reviews the research background of remote sensing image classification, expounds the basic theory and some image preprocessing methods, a brief overview of the concepts and pri
6、nciples of remote sensing image classification, remote sensing classification method for the traditional (supervised and unsupervised classification) are analyzed, looked to the recent emergence of some new computer classification methods, including artificial neural network and fuzzy classification
7、, and then analyses the principle of each method, algorithm and their respective advantages and disadvantages. Finally, elaborates the accuracy evaluation of distance classification method and the classification of remote sensing images.VOne of the important ways to wide application of remote sensin
8、g technology is a remote sensing image classification, and the accuracy of classification directly has a great effect on the application level and practical value of remote sensing data. although Traditional supervised classification and unsupervised classification method have certain advantages of
9、their own, they have some disadvantages. Although various classification methods have different characteristics, in practice only the comprehensive application of multiple classification methods in order to improve the classification accuracy and precision.KEY WORDS: remote sensing, image classifica
10、tion, accuracy assessment 1. 绪论1.1 选题背景遥感图像是按一定大小的比例,真实和客观地记录并反映地表上的物体电磁波辐射的强弱情况,它是遥感进行探测并按一定的方式获得的相应信息的一种表现的形式1。遥感技术的核心问题是根据在遥感图像上地物表现出的电磁辐射强弱的不同,对地物进行判读以后,然后对地面物体的所属情况和分布的特征进行一一识别。我们在探讨遥感技术时,遥感图像的分类在提取专题信息,监测动态变化,制作专题地图,建立遥感数据库等方面都起着重要的作用。遥感图像的应用随着试用地方的变化而发生相应的变化,所以对遥感图像处理提出了更多更细的要求,因此图像分类环节的位置日益突
11、出,许多经典的分类方法和算法也在多年的努力和发展中应运而生。遥感图像分类主要通过两种方法,一种是传统的目视解译,一种是计算机分类。最先出现的分类技术是图像目视解译分类,这种方法通过对遥感图像上的一系列特征进行处理,例如综合分析、比较、推理和判断,最后对有必要的信息进行提取。它的优点是灵活性较好,空间相关信息的获得更容易,但缺点是如果需要知道确切的位置有点困难,时效性差,不能够进行重复,并因人引起的差异较大。目前,目视解译被广泛应用在对精度较高图像的判读中,如达到米级高分辨率遥感图像,原因就在于计算机分类的精度比目视解译的相应精度要低。计算机遥感图像分类是就是将图像的所有像元按其性质分为若干个类
12、别的过程,同时也是模式识别技术在遥感领域中的具体应用2。计算机遥感影像分类方法主要包括句法模式方法和统计模式方法。统计识别模式,如K-最近判别法、最大似然法等是分类方法中一般较常见的。句法方法在近年来发展的分类新方法中较多的被采用,这类方法有模糊数学方法、决策树分类法、专家系统法、人工神经网络方法等。确定不同地物类别间的判别接口和判别准则是计算机遥感图像分类的中心任务,它的优势主要在于可以重复进行,准确知道确切的位置,需要的时间较短,有效率。目前的遥感图像分类应用的现状是传统的模式识别分类方法被应用较多。遥感图像自身所有的空间分辨率以及同种地物不同光谱分辨率或者不同地物同种光谱分辨率的影响,同
13、时很多分错的情况例如错分、漏分都会降低分类的精度。但目前很多改进后的算法大大提高了分类的精度。此外,很多新的分类方法在国内外也相继出现,例如人工神经网络分类法(Artificial Neural Network)、模糊分类法、支撑向量机分类法(Support Vector Machine)、决策树分类法(Decision Tree Classifier)以及亚像元分类法(Subpixel Classification)3。本文的目的主要在于对这些分类方法和算法进行一个完整的概括,对遥感图像分类提供一些基础理论,其中重点介绍了距离分类方法,并且对精度进行了评定3。1.2 我国遥感技术分类现状从上
14、个世纪70年开始,从第一颗地球资源卫星(ERTS-1)发射成功,人类开始了一个新纪元即研究以计算机作为辅助工具,解译卫星遥感图像。解译主要是对卫星的数字图像进行位置配准和几何校正,早期这些都是通过数字图像处理软件来实现的,并这个基础之上从遥感图像中获取有关地物的信息是通过人和计算机的共同协作来实现的。采用这种方法的实质却依然是遥感图像的目视判读方法,因为它对图像解译人员的解译水平和经验依赖程度较大,并没有找到实现在遥感图像分类的更好的方法。 统计模式识别方法是遥感图像计算机分类方法的一种,在20世纪80年代后开始占据重要的位置,它的特点是利用地物的相应光谱特征在图像中不同表现对影像中的地物相应
15、的进行分类。这些方法促进了遥感图像利用计算机进行分类的快速发展。 上个世纪90年代一直到现在,以前采用的大量遥感图像分类的方法仍然被应用,例如,在遥感图像分类中,采用的支撑向量机和神经网络等方法具有很大的优势4。1988年,遥感图像分类中增加了神经网络算法。它具有对信息的分布式进行存储,并依靠自己并充分发挥自身优势等一些较好的特点,才在遥感图像分类的领域中被人们广泛的使用。又如MuralH(1997)提出了基于知识发现和神经网络的分类的新方法,而贾永红等发现了基于BP神经网络的多源遥感影像的分类方法5,支撑向量机是由Vapnik提出的。刘志刚对基于支撑向量机的非监督分类遥感影像分类新方法进行了
16、探讨6。遥感影像在进行空间特征提取时产生了一种新的方法,这种方法以支撑向量机(SVM)为基础,并且把SPOT全色波段影像上城市特征的主要信息的提取为应用实例,综合比较了各种特征提取方法,证明了不仅在可表达性、特征空间高维不限制、学习速度、自适应能力等方面具有优势,而且具有比较高的分类精度。自从模糊集理论提出以来,在模糊信息处理方面的应用理论有了很重大的进步,模糊模式识别方法也应运而生。它能够在语音识别、图像分割以及文字识别中陆续的被使用,经过试验获得了很好的效果。因为地球表层的信息具有复杂和易获得的特点,而且地表的信息是无限的,所以遥感信息之间的复杂以及遥感信息在传递过程中所受到限制较大相关,
17、所以实际上遥感图像所具有的信息不单单是单纯的地物信息,往往在地形情况较复杂的或者是空间分辨率低的影像单元中能看到多种地物的综合反映情况。基于模糊模式识别的这一主要特点成了遥感影像分类研究中的重要特征。而且,还有像莫源富对从山区获得的遥感图像提出了相应的按照分区进行的分类法,并充分利用GIS的强大功能,对其分类进行辅助,在遥感图像的识别方面取得了很大的进步。2 遥感图像2.1 遥感概念遥感就是在不与物体直接相接触下,对自然现象或目标物很远距离进行感知的一门新的探测技术。从具体方面来讲就是,利用在空中以及外大气层的各种平台,应用相应传感器获得能够反映地物表面特征的各种信息数据,通过进行传输,经过变
18、换和相应的处理,把有用的信息提取出来,从而实现了研究地物空间的性质以及形状和位置的变化及其与环境的相互关系的一门现代应用技术科学7。根据上面的说法,人以及动物都具有一定的遥感能力。比如,人眼能够对物体进行识别的过程本身就是一种遥感识别的过程,它是通过识别物体亮度、色调,物体的大小以及形状等相应的信息,用来判别物体的分类及属性。蝙蝠能够用发射出的超声波以及接收到反射波来判别出障碍物的属性、方位以及距离。2.2 遥感图像的几何处理2.2.1 遥感图像的几何变形遥感图像变形的几何变形是指原始图像上与在参照系统中的表达要求的各地物的几何位置、形状、方位等特征不一致时产生的变形8。 我们一般将变形误差分
19、为两类,一是内部误差,二是外部误差。内部误是由于传感器自身的性能特性的指标偏移量所造成的。内部误差随着传感器结构的不同而不同,通过重新检核的方式在地面上可以测定出它的特点,它的误差值较小。外部变形误差是指传感器自身处于正常的状态下,除了传感器自身以外的其他各种因素所引起的误差。遥感图像的变形主要是由以下因素引起的:第一,地球自转的影响,第二,传感器外方位元素变化的影响,第三,地球曲率引起的图像变形,第四,地形起伏引起的像点位移,第五,大气折射引起的图像变形,第六,传感器成像方式引起的图像变形。对遥感图像进行的几何校正,一般说来可分为以下几个步骤:(1)确定所用的校正方法通过图像中用于的进行几何
20、校正的一些数据和几何畸变的相应特性,选取用于几何校正相应的方法。校正方法一般有多项式法、共线方程法、随机场内的插值法等。由于多项式法具有使用上较为方便,原理比较通俗易懂的特点,且在各种类型的图像上都可以应用,因而多项式法在遥感图像几何校正的空间变换上较多被采用。这里主要是指相应系统的校正,即与传感器构造特征相关联的校准数据,如焦距的大小等,还有测出的传感器的一些值代入到能够用来消除图像几何变形的理论校正公式中来实现目的。(2)确定校正的公式公式利用控制点的地图坐标和图像坐标之间的关系,被用来确定所应输出的地图坐标和给定的图像坐标之间的坐标变换,主要用于对图像的非系统性进行校正。而坐标变换式经常
21、采用l、2次等角的变换,2、3次投影的变换或采用高次多项式变换。利用最小二乘法对控制点的地图坐标值和图像坐标值可以求出坐标变换式相应的系数。(3)验证所采用的校正方法及校正公式的相应精度校正后,我们检查几何畸变是否得到充分的校正,若不能得到很好地校正,我们要对其原因进行分析,这样更为有效的几何校正方法才能被提出来,第二次校正才能被实施。(4)数据重采样和线性内插为了使输入的未校正图像和校正后输出图像的像元相互对应,要进行重新采样。重采样主要有两种方法,即:计算出输入图像的各个像元点的位置和输出图像坐标系相应位置的变化,并把各像元的数据投影到相应的位置上;而对输出图像的各像元的位置在输入图像坐标
22、系的相应位置的变化进行逆运算,得到该位置上的像元的数据。在重新采样这种方法中,由于用于计算的对应位置的坐标值是小数,要求出新的像元值就必须考虑周围的像元值,然后通过线性内插的方法获得。几何校正常用的内插方法包括:3次卷积内插法(CC:cubic convolution)、最邻近内插法(NN-nearest neighbor)以及双线性内插法(BL:bi1inear)。2.2.2 遥感图像增强图像增强的实质是加大目标和其周围背景图像之间的差距。遥感图像增强是计算机自动分类的一种预处理方法,为了特定目的,使遥感图像中的一些信息更加醒目,减少受不必要信息的干扰,使判读图像更加容易。图像增强的目的主要
23、有:改变图像灰度范围及灰度等级,相应的提高图像对比度;抑制噪声,使图像变得平滑;突出地物的边界和线性形状地物,合成彩色的图像;锐化所需图像;压缩较大图像的数据量,突出所需要的主要信息等。目前,空间域和频率域的处理是遥感图像增强处理技术中较为常用的两大类。首先对图像进行傅里叶变换,然后修改变换后的频率域图像的频谱来达到增强图像的目的,这就是频率域图像增强。空间域图像增强是通过改变单个像元及邻近像元的灰度值来增强图像,主要包括点运算的图像增强和邻域运算的空间增强。(1)对比度变换如果要改变图像像元的亮度值,那么就要将图像之间的差距减小,并且这种改变在运算过程中有一个变换函数,从而可以符合一定的数学
24、规律。直方图调整,线性变换以及非线性变换等是对比度扩展中较为常见的方法。一般情况下,我们用的更多的则是线性变换,因为它在处理图像增强方面很具有优势。所谓线性变换是把函数变化成为线性关系或者变为分段的线性关系,如: (2-1)在2-1式中,a,b为所需测定的系数值。我们需要将范围扩大,经常把函数变为原图像的相应亮度值的动态范围。非线性变换是在变换函数是非线性的情况下来定义的。对数变换、指数变换、平方根变换等是非线性变换中较为常见的方法,它们各有自己的优势和缺点。其数学表达式: (2-2) (2-3) (2-4)式中,a,b,c为可选择的控制参数,控制曲线的截距、变化率、起点等。它们可以使动态范围
25、的可选择性加大,变换的方式也更加灵活。对于低亮度值区域的扩展一般用对数变换进行。而指数变换的效果是压制暗区而突出亮区。因而二者互为逆运算的操作。平方根变换可以改变方差和均数的病态分布或图像数据相应的偏态分布,可以对高亮度值和低亮度值区域均都可以进行改善。查表法是非线性变换中一种较为常见的方法,因为它虽然简单,但是效果却非常好。它会列一个个的表格,用此来代表亮度值的输出与输入间的变换关系,在其中一个已知值已知的情况下,要想知道其对应的输出值,只需要查一下表格即可。直方图的调整是指通过对函数的关系的变换,求出所要求的直方图,并调整原图像的亮度值。直方图的调整包括直方图匹配、直方图均衡化以及直方图的
26、正态化。(2)彩色的合成假彩色合成方法假彩色合成是指利用人眼看不到的红外波段来把某些图像进行的彩色合成,这种情况主要是由于在摄影测量中如果需要用到许多波段,那么一副完整的图像不可能全部都在三原色的波长范围内。 真彩色合成方法如果对同一地物进行拍摄,拍出用红、蓝、绿三原色进行合成的三张图像,同时使用的滤光片是红、蓝、绿三原色,那么得到的颜色将会非常接近天然色,这被称作真彩色合成。方案的选择在影像合成过程中占据重要位置,因为它决定了彩色影像是否显示某一方面的信息或者能够显示出较丰富的信息。现在以陆地卫星Landsat的TM卫星影像为例子,标准假彩色合成方案是指在进行彩色影像合成时,分别把蓝、绿、红
27、三种颜色赋予给2,3,4波段。为了能够更好地贴合实际地应用,我们的分析调试是根据应用目的的不同来决定的,这样得到的最后方案才能更具有优势,同样的,目视效果也更加完美。(3)滤波空间的滤波(spatial filtering)就是指在空间频率域图或像空间(x,y)对输入的图像应采用若干滤波函数来去获得改进后的输出图像,即我们要增强或抑制图像中的某些频率特征以及空间的信息,例如抑制低频信息而增强高频信息,即用来突出图像的纹理、线条、边缘等。其效果能够改善影像的质量,包含让高频噪声消失或者使其干扰降到最低。空间滤波技术的思路有以下几条:加权处理从原图像获得的边缘信息,再与原图像进行相迭加;处理原图像
28、中的模糊成分,再与原图像进行迭加;为了使图像产生特定的效果,例如平滑或尖锐,我们必须引进一特定的函数,然后再对图像进行加权处理9。我们采用的更多的是空间卷积技术来进行运算,也就是逐块的进行局部运算,在原图像上移动“活动窗口”。(4)主成分分析(KL变换)KL变换是一种线性变换的方法,离散KarhunenLoeve变换的简称,也被叫作主成分变换,它的主要目的是压缩数据和增强信息,以不同的变量为基础,尽量保证有用的信息仍然能够存在。它是对某一多光谱图像X,利用K_,变换矩阵A进行线性组合,而产生一组新多光谱图像Y的操作,表达式为:Y=AX (2-5)其中X代表着变换前多光谱空间的像元向量,Y为变换
29、后主分量空间的像元向量,A为变换矩阵,因此,公式可写为: (2-6)对图像中每一像元向量逐个乘以矩阵A,便得到新图像中的每一像元向量,A的作用是给多波段的像元亮度加权系数,实现线性变换。由于变换前各波段之间有很强的相关性,经过KL变换组合,输出图像Y的各分量Yi之间将具有最小的相关性。(5)穗帽变换(K-T变换)KT变换是KauthThomas变换的简称,形象的称为穗帽变换。缨帽变换旋转坐标空间,但旋转后的坐标轴不是指到主成分的方向,而是指到另外的方向,这些方向与地物有密切的关系,特别是与植物生长过程和土壤有关。缨帽变换既可以将大量繁杂的信息简单化,又可以对农作物的特点进行深刻了解,其变换公式
30、为:Y=BX (2-7)这里B为变换矩阵,Y为变换后的新坐标空间的像元向量,x为变换前的多光谱空间的像元向量。它旋转后的方向与地面景物有着密切的关系,而不是指向主成分方面,它是旋转了坐标空间的线性变换。(6)HIS彩色空间变换HIS是色调(H:hue)、明度(S:saturation)和饱和度(I:intensity)的色彩模式,又称HLS,(hue,tightness,saturation)。这里的色调,即人们视觉的颜色;明度,即光的明亮程度;饱和度,即颜色的纯度,饱和度越高,纯度越高,颜色越浓。这种彩色模式完全与人眼睛视觉效应。这种模式的定量化是通过近似的颜色立体来实现的。在某些情况下,图
31、像可从常用的红绿蓝表达方式转换到HLS表达方式,RGB与HLS两种色光表示方法的参数可以通过特定模型相互转换。2.3 特征提取和特征选择面对众多的复杂的特征,如何快速有效地找出我们所需要的是特征提取及选择的基本任务。对被识别对象进行处理,将基本的特征提取出来是特征的形成的形式,它可以是用仪表或传感器测量来的,也可以是计算出来的,这样得到的特征叫被叫做原始特征。特征选择就是直接从一组相应的特征中挑选出一类最有效的特征来降低空间维数的过程。原始特征的样本可能处在一个高维的空间中,因此它的数量可能很大,或者,通过变换或映射的方法在低维空间中来表示样本,这个过程就是特征提取。特征提取的方法主要如下:(
32、一)对子集进行选择,即针对分类地物的特征,对所有测出的波段进行处理,提取一些波段当做特征。波段的选取可用经验进行选择,也可根据下面的公式进行选择。 (2-8)在上式中Si为第i个波段的标准方差,如果Si越小,那么该波段图像的信息量也就越少;砥表示第i以及第J个波段之间的相关联的系数,如果Rij越小,那么两个波段之间的相互独立性越高。则OIF值越小,波段的组合越差。 (二)对于主成分的分析,用K-L变换的结果去选取M个能量较大的分量去取代原来的那些D个分量。并通过K-L的变换,把原有向量各分量之间的相关性消除了,进而才有可能把那些带有很少信息量的坐标轴去掉来降低特征空间维数。 (三)比值处理,即
33、把各波段的数值运算作为一个新特征,例如植被指数以及相应的比值等。(四) 线性相互组合,即得到新特征向量的每个分量为原来D个分量的线性的相互组合。(五)有用信息的提取。在进行模式识别时,光有波谱信息的参与是不行的,因为遥感图像中许多空间结构信息例如纹理信息等,而纹理信息可用来提高分类的精度。纹理的测度可能用马尔可夫随机场、小波变换的方法、半变差函数的方法。而特征的选择是对于特定的专题信息的提取而说的,如果选择的特征过少,那么分类器的设计以及实现就比较简单,但是它分类的精度不够高;如果选择的特征过多,分类器的设计以及实现就比较复杂,分类的效果也不是好。3. 遥感图像分类遥感图像的分类,又称遥感模式
34、识别,通常模式识别是指把具有某种空间或集合特征的东西,或者许多同类物体用某种固定的相关行式重复进行布置。在模式识别的应用中,不管任何一组有意义的测量都能够成为一种模式,例如因为不同地物有不同的有不同的波长辐射,那么把它们的的响应特性的组合起来就可以能够看成是不同光谱数据的测量模式。简单的说,一个模式可以看成一个多维空间中的一个相应的点。模式识别就是对需要进行分类或识别的对象展开一系列的测量然后利用某种分类将这些测量所构成的模式采用判决规则判别出某一类别的过程。又因为自然界的变化丰富多彩,空间以及时间每时每刻都在变化、再加上遥感仪器的噪声以及自身所具有的误差等的影响,这就导致了即使地物在类型上再
35、相似,在模式矢量中,它们也不可能一模一样,它们在空间分布呈点群状而不是单独的一点。3.1 遥感图像分类原理计算机遥感图像的分类模式识别技术的目的是对图像上的每个像元给出对应类别。图像的分类就是相应的模式分类(Pattern Classification)在图像处理过程中的具体应用,它的主要功能就是将图像数据从二维灰度空间变换到目标模式空间之中。图像分类器(Image Classifier)就是给定一个二值均匀测度函数P,如果在图像中相应的区域满足一定意义下的均匀特性,则该区域的P值是真,反之为假。图像的一个分类就是为了获得图像的一个划分,其中代表第i类属性的区域值,该划分应满足:(1),其中
36、f ( x,y)包含像素点的总集(2)是连通的(3)如果相邻,且,但。理想的分类器应具有以下的性质:(1)鲁棒性( Robustness),如果微小地改变了输入的数据,那么将不会有什么反应,即输出结果的有效性受到微小输入变化或随机噪声的影响,一般地,应使分类后不同的图像区域间性质的差异应尽量变大,而应该把区域内部性质保证平稳。(2)分类过程的可重复性是在相同数据的情况下,如果换由其他测试者来执行,那么得到的结论将会是相同的。图像的分类过程主要包含 4 个步骤, (1)图像数据预处理(Preprocessing),就是利用对观测数据作成像处理,并且针对图像的量化、采样、几何矫正、去噪声以及预滤波
37、等处理。(2)训练集的选择,即训练样本是从待处理数据中抽取出具普遍性并且具有代表性的数据。(3)特征提取(Feature Extraction)是从很多的样本数据中特征矢量提取出来,实现样本空间与特征空间的相互转换,并且特征的提取应该能反映出观测目标的特征。(4)图像分类运算(Classification)就是利用特征矢量集利用特定的分类器在特征空间进行划分的基础之上去完成了分类工作。3.2 监督分类监督分类是在我们对遥感图像上样本区内地物的类别已知的基础上,把这些样本类别的特征当做来识别非样本数据的类别的依据。所谓监督分类就是根据我们知道的判别类别和样本类别的经验知识,确定出判别函数以及判别
38、准则,其中利用一定数量的已知类别的样本观测值把待定参数求解出来的过程称之为训练或学习,然后把未知类别的样本的所有观测值代入到这个函数中求出的判别函数,再根据相应的判别准则对该样本的所属类别做出判定。3.2.1 监督分类的步骤监督分类的一般步骤如下: (1)首先把感兴趣的类别数确定出来。确定对哪些相应的地物进行分类,这样就可以建立起地物的先验知识库。 (2)特征选择和特征变换。特征变换就是原图像通过一定的数字变换生成一组新的特征图像,这一组新的特征影像信息集中在少数几个特征图像上,这样数据量有所减少。遥感图像自动分类中主要的特征变换有主分类变换、哈达玛变 换、生物量指标变换、比值变换以及穗帽变换
39、等。最常用的特征变换是主分量变换。(3)选择一定的训练样区。因为监督分类都是从训练样区获得关于类别的数字特性的,因此选择的训练样区的一定要一定的代表性。训练样区的选择很重要,因为它将会影响到分类结果的准确性。同时训练样区的选择要有代表性、准确性以及具有一定的统计性。代表性一方面要考虑到地物本身的复杂性,另一方面指所选择区为某一类地物的代表,所以必须能够在一定程度上反映相应的一类类地物光谱特性的波动情况变化;准确性就是要确保实际地物与所选择的样区一致性;统计性是指在训练样区内选择出足够的像元,保证用此计算出的类别的参数符合统计学的相应规律。在应用中,每一类别的样本数量包含数量级左右。(4)把判别
40、规则以及判别函数确定出来。因为训练样区被选定的话,就可以利用所建立起的训练样区中的参照样本把其对应的地物类别的光谱特性进行统计出来。图像分类运算就是根据判别 函数和判别准则对非训练样本区进行分类,对特征向量集进行划分、完成分类识 别工作。 (5)根据判别规则和判别函数对非训练样区的图像区域进行分类。完成以上步骤,然而我们可以提取一幅分类之后的编码影像,每一编码对应的类别属性也应该被知道。这样不仅达到了类别之间区分的目的,而且类别也被识别出来。3.2.2 最大似然分类法最大似然分类 (maximum likelihood classification )就是在两类或两类以上的判决中,用概率统计的
41、方法并根据其最大似然比贝叶斯的判决准则法把非线性判别函 数集建立起来,并且假定各类分布函数的均为正态分布,并选择一定的训练区,然后计算各待分类样区的归属概率的大小, 从而进行分类的一种图像分类方法。 最大似然分类法有严密的理论础,对于呈正态分布的类别判别函数易于建立,综合应用了每个类别在各波段中的均值,它的方差以及与各波段之间的协方差,具有较好的统计效果,所以它一直被人们认为是较先进的分类方法之一10。 最大似然法在传统的遥感图像分类中应用的比较广泛。该方法是通过对感兴区域的计算以及做出统计,得到各类别的方差以及均值等参数,从而把一个分类函数确定出来,再将待分类图像中的各个值像元代入到各个类别
42、的分类函数中去,并把函数返回值最大的类别当做成所有被扫描像元值的归属性类别,进而达到所需分类的效果9。它主要的过程如下:(1)确定所使用的波段数、特征分类数以及分类的地区,检查是否对所用的各波段或者其特征分量进行了相应的位置配准;(2)根据已掌握的典型地区的地面情况在图像上选择训练样区;(3)计算参数,根据选出的各类训练样区的图像数据计算和确定先验概率;(4)分类,将训练样区以外的图像像元逐个逐类代入公式,对于每个像元分几类就计算几次,最后比较相应大小,选择最大值得出类别;(5) 产生分类后的图,并且给每一类别规定一个适量的值,如果分为了10类,那么就规定每一类分别为1,2,10,用类别值分类
43、之后的像元值所取代,最后我们得到的分类图像就是所需要的专题图像。由于最大灰阶值在数值上等于类别数值,所以在监视器显示时需要给各类别添上不同的颜色;(6)如果在分类中产生的错误较多,就需要重新选择训练区再重复做以上的各步,直到其结果令我们满意为止。3.2.3 平行多面体分类方法平行多面体分类的方法(Parallelpiped ciassifier)就是根据把设定在各轴上相应的值域分割出多维特征空间的方法10。此方法需要通过选择一定的训练区,并且对分类类别的特征与状况要详细了解,并用较高的精度对每个分类类别的光谱特征下限值和上限值进行设定,以便形成特征的子空间。平行多面体分类的方法必须要求训练样区
44、样本能够覆盖所有的类型,并利用它的待分类像素的光谱值与各个类别特征子空间的每一维上的相应的值域进行内外判断,并检查它落入哪个类别特征子空间中,一直到完成各像素的分类。用这种方法进行分类就需要由训练组数据学习而产生一定基本的统计量信息,包括每个类别的标准向量以及均值向量。若有n个波段,m个类别,用代表第i类第j波段的均值,为对应的标准差,为x在j波段的像元值。对于某一个类别i(i=1,2,m)当像元x满足: (3-1)如果像元在所有波段的灰度都符合上述条件,就把像元x归入第i列,即Class(x)=i;反之不能归入已知类别,即Class(x)=0。式中T为人为规定的一个阀值,和概率分布出发差不多
45、,应该采用几个标准差作为可信的分类边界,T越大则一个类的范围也就越大。这种方法简单,计算速度相对比较快。但是主要问题是实际地物类别数据点分布的点群形态用按照各个波段的均值为标准差划分的平行多面体有很大的不一致,也就造成俩类的重叠,混淆不清的情况出现。3.2.4 最小距离分类方法最小距离分类法是以特征空间的距离作为像素分类的依据。首先从训练样本数据当中来得出每一类别的协方差矩阵和均值向量,然后把各类的均值向量当作该类在多维空间中的中心位置。计算输入图像中的每个像元到各类的距离,到哪一类中心的距离最下,则该像元就属于哪一类别。因此,在这类分类方法中距离就是一个判别函数。 距离判别函数分类并不像贝叶
46、斯判决函数那样来对于于集群分布的统计特性偏重, 而是偏重于分类的几何位置, 其通用判决形式如下:若对于所有可能的j=1,2,m, ji 有di(X)dj(X),则X 属于类。在实践中三种距离判别函数:( 1) 马氏(Mahalanobis) 距离: (3-2)( 2) 欧氏( Euchidena) 距离: (3-3) ( 3) 计程( Taxi) 距离: (3-4)为了提高遥感图像的分类精度, 就需要综合利用多波段卫星图像, 因此图像融合是很好的方案之一。又因为所考察的地物在遥感图像上的图斑比较零散, 而且灰度值的范围很宽, 因此在两个目标之间,目标和其背景之间往往就属于非线性分类或线性不可分
47、的问题, 这也是对分类精度影响的一个很重要原因 。因此出现了一种自适应最小距离的算法并且在它基础上的用核空间理论进行了改进自适应最小距离算法。它的原理是把样本集合进行分解, 获得样本分布估计; 然后, 把在实际分类中待分类的点到每一类的相应距离根据分解的结果求出来, 把此作为分类依据。通过用核空间理论改进的自适应最小距离算法来引入核空间理论, 将在输入空间中不能进行线性分类问题映射到一个可以进行线性分类的高维空间, 并利用核函数性质避免了其在高维空间中运算的复杂性, 因此很好的解决了非线性分类的问题。最小距离分类原理较简单,虽然分类的精度不高,但计算的速度很快,它可以使用在快速浏览分类概况中。3.3 非监督分类非监督分类 (Unsupervised Classification )是一种无先验(已知)类别标准的图像分类是利用不同影像中地物在特征空间中类别特征的差别作为依据的分类,它是以集群为理论作为基础,用计算机对图像进行集聚统计分析的分类方法。可以根据待分类样本特征参数的统计特性,建立起一定的决策规则并用来进行分类。它不需要事先知道类别的特征。它把各样本的空间分布按其一定的相似性进行合并或分割成一群集,每一群集代表着各自的的地物类别,它需经实地进行调查或则与已知类型的地物相互比较才