《空间统计分析.pptx》由会员分享,可在线阅读,更多相关《空间统计分析.pptx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、空间统计分析,即空间数据(Spatial Data)的统计分析,是现代计量地理学中一个快速发展的方向领域。空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。空间统计分析的任务就是运用统计分析方法,建立空间统计模型,从凌乱的数据中挖掘空间自相关和空间变异规律。什么方法?经典统计方法的基本假设:样本独立地理学第一定律地统计学理论与方法引子引子在地球表面,每一个事物都和其它事物相联系,而距离越近则它们的联系也越强。第1页/共39页探索性空间统计分析(Exploratory Spatial Data Analysis,ESDA),是指
2、利用统计学原理和图形图表相结合对空间信息的性质进行分析、鉴别,用以引导确定性模型的结构和解法。它实质上是一种“让数据说话”的分析技术。地统计(Geostatistics)又称地质统计,是法国著名统计学家 G.Matheron在大量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象的一门科学。第2页/共39页第第1节节 探索性空间统计分析探索性空间统计分析 一、基本原理与方法 (一)空间权重矩阵 (二)全局空间自相关 (三)局部空间自相关 二、应用实例 三、软件实现 第3页/共39页空间自相关(Sp
3、atial autocorrelation)是指同一个变量在不同空间位置上的相关性。目的在于检验空间单元与其相邻的空间单元的属性间是否具相似性。如何定义“相邻”?空间权重矩阵空间自相关分析可分以下 3个过程:首先建立空间权重矩阵,以明确研究对象在空间位置上的相互关系;其次进行全局空间自相关分析,判断整个区域是否存在空间自相关现象或集聚现象;最后进行局部空间自相关分析,找出空间自相关现象存在的局部区域。一、基本原理与方法 第4页/共39页通常定义一个二元对称空间权重矩阵,来表达个位置的空间区域的邻近关系,其形式如下:式中:W Wijij表示区域i i与j j的邻近关系。权重的确定主要依据地理特征
4、,如地区边界和距离等,这样可以保证空间权重矩阵的外生性。它可以根据多边形邻接标准或距离邻接标准来度量。n n表示n n个区域单元。(一)空间权重矩阵 第5页/共39页(1)简单的二进制邻接矩阵(2 2)基于距离的二进制空间权重矩阵 两种最常用的确定空间权重矩阵的规则:两种最常用的确定空间权重矩阵的规则:距离邻接标准:以某一研究对象为中心,一定距离为半径,将落入半径范围内的研究对象定义为相邻。多边形邻接标准:两个空间单元是否具有公共边或公共点,前者定义为边相邻,后者定义为角相邻。第6页/共39页(二)全局空间自相关(二)全局空间自相关 衡量空间自相关的指标有Moran指数I、Geary系数C、G
5、统计量等,他们都有全局指标和局部指标两种。全局空间关联指标用于探测某现象在整个研究区域的空间分布模式,分析其是否有聚集特性存在。Moran指数I是由 Moran于 1948年提出的,反映的是空间邻接或空间邻近的区域单元属性值的相似程度。Geary 系数与Moran指数存在负相关关系。由于 Moran指数不能判断空间数据是高值聚集还是低值聚集,Getis和 Ord于 1992提出了全局 G系数。G系数一般采用距离权,要求空间单元的属性值为正。第7页/共39页如果x xi i是位置(区域)i i的观测值,则该变量的全局MoranMoran指数I I,用如下公式计算:式中:I I为Moran指数 I
6、的期望值:E(I)=-1/(n-1)随着样本数 n的增大将逐渐趋于 0。式 中,i、j代表不同的空间单元代号;n表示所有空间单元的个数;x表示空间单元的属性值;所有相邻区域的协方差之和所有相邻区域的标准差之和第8页/共39页 Geary 系数C计算公式如下:式中:C为Geary系数;其它变量同上式。如果引入记号:第9页/共39页则全局Moran指数I的计算公式也可以进一步写成:MoranMoran指数I I的取值一般在-11-11之间,大于0 0表示正相关即属性值高的区域与属性值高的区域聚集在一起,属性值低的区域与属性值低的区域聚集在一起。小于0表示负相关,等于0表示不相关;值越趋近于1,总体
7、空间差异越小。值越趋近于-1,总体空间差异越大。当Moran I接近于-1/(n-1)时,观测值之间才相互独立,即属性的分布呈无规律的随机分布状态。GearyGeary系数C C的取值一般在0202之间,大于1 1表示负相关,等于1 1表示不相关,而小于1 1表示正相关。第10页/共39页对于MoranMoran指数,计算结果可采用随机分布或近似正态分布进行验证。可以用标准化统计量Z Z来检验n n个区域是否存在空间自相关关系,Z Z的计算公式为:当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值
8、趋于分散分布,如高值与低值的观测值集聚;当Z值为零时,观测值呈独立随机分布。检验是否显著,可以通过查标准正态分布表计算z的p值,再将它与显著性水平进行比较。一般来说,z1.96,则在0.05水平上显著;z1.64,则在0.1水平上显著。第11页/共39页 对于Z Z的计算公式式中:Wi.为空间相临权重矩阵i 行 W.i为i 列 第12页/共39页(三)局部空间自相关(三)局部空间自相关 全局型指标能够判断出现象在空间上的整体分布情况,但难以探测出聚集的位置所在及区域相关的程度。忽略了空间过程的潜在不稳定。到底是高高集聚还是低低集聚?哪个区域单元对全局贡献更大?这就必须进行局部空间自相关分析。局
9、部指标用于反映整个大区域中,一个局部小区域单元上的某属性值与相邻局部小区域单元上同一属性值的相关程度。第13页/共39页局部空间自相关分析方法包括三种分析方法:空间联系的局部指标(Local indicators of spatial association,缩写为LISA)LISA):局部(Local)Moran I和局部GearyGeary系数G G统计量 MoranMoran散点图 第14页/共39页1.1.空间联系的局部指标空间联系的局部指标(LISA)(LISA)空间联系的局部指标(LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元与其周围显著的相似值区域单元
10、之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。局部Moran指数(Local Moran)和局部Geary指数(Local Geary)的定义可以满足这两个条件。第15页/共39页局部Moran指数被定义为:式中:其中 和 是经过标准差标准化的观测值。局部MoranMoran指数检验的标准化统计量为:第16页/共39页2.G2.G统计量统计量 全局G统计量的计算公式为:对每一个区域单元的统计量为:第17页/共39页对统计量的检验与局部Moran指数相似,其检验值为:显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区
11、域单元趋于空间集聚与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比(高高集聚或者低低集聚),具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。第18页/共39页3.Moran3.Moran散点图散点图 以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2sigma规则可视化地识别出来。第19页
12、/共39页Moran散点图的四个象限,分别对应于区域单元与其邻居之间四种类型的局部空间联系形式:第一象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第二象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第三象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式;第四象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。第20页/共39页与局部MoranMoran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于MoranMoran散点图的不同象限,
13、可识别出空间分布中存在着哪几种不同的实体。将MoranMoran散点图与LISALISA显著性水平相结合,也可以得到所谓的“MoranMoran显著性水平图”,图中显示出显著的LISALISA区域,并分别标识出对应于MoranMoran散点图中不同象限的相应区域。第21页/共39页二、应用实例二、应用实例 (一)中国大陆各省份人均(一)中国大陆各省份人均GDPGDP的空间关联分析的空间关联分析根据各省份之间的邻接关系,采用二进制邻接权重矩阵,选取各省份1998199820022002年人均GDPGDP的自然对数,依照公式计算全局MoranMoran指数I I,计算其检验的标准化统计量Z Z(I
14、 I),结果如表4.1.34.1.3所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000第22页/共39页从从表表中中可可以以看看出出,在在1998-2002年年期期间间,中中国国大大陆陆31个个省省份份人人均均GDP的的全全局局Moran指指数数均均为为正正值值;在在正正态态分分布布假假设设之之上上,对对Moran指指数数检检验验的的结结果果也也高高度度显显著著。这这就就是是说说,在在1998-2002年年期期
15、间间,中中国国大大陆陆31个个省省份份人人均均GDP存存在在着着显显著著的的、正正的的空空间间自自相相关关,也也就就是是说说各各省省份份人人均均GDP水水平平的的空空间间分分布布并并非非表表现现出出完完全全的的随随机机性性,而而是是表表现现出出相相似似值值之之间间的的空空间间集集聚聚,其其空空间间联联系系的的特特征征是是:较较高高人人均均GDP水水平平的的省省份份相相对对地地趋趋于于和和较较高高人人均均GDP水水平平的的省省份份相相邻邻,或或者者较较低低人人均均GDP水水平平的的省省份份相相对对地地趋趋于于和较低人均和较低人均GDP水平的省份相邻。水平的省份相邻。第23页/共39页选取2001
16、年各省份人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。第24页/共39页检验结果表明,贵州、四川、云南西部三省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该四省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对
17、较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。第25页/共39页以(以(Wz,zWz,z)为坐标,进一步绘制)为坐标,进一步绘制MoranMoran散点图散点图可可以以发发现现,多多数数省省份份位位于于第第一一和和第第三三象象限限内内,为为正正的的空空间间联联系系,属属于于低低-低低集集聚聚和和高高-高高集集聚聚类类型型,而而且且位位于于第第三三象象限限内内的的低低-低低集集聚聚类类型型的的省省份份比比位位于于第第一一象象限限内的高内的高-高集聚类型的省份更多一些。高集聚类型的省份更多一些。第26页/共39页HH:北京、天津、河北京、天津、河南、安徽、湖北、江西、南、安徽、湖北、
18、江西、海南、广东、福建、浙海南、广东、福建、浙江、山东、上海、江苏江、山东、上海、江苏LL:黑龙江、内蒙古、黑龙江、内蒙古、新疆、吉林、甘肃、山新疆、吉林、甘肃、山西、陕西、青海、西藏、西、陕西、青海、西藏、四川、云南、辽宁、贵四川、云南、辽宁、贵州州LH:湖南湖南HL:重重庆庆、广广西、河北西、河北第27页/共39页上上图图进进一一步步显显示示了了各各省省人人均均GDPGDP局局部部集集聚聚的的空空间间结结构。可以看出,从人均构。可以看出,从人均GDPGDP水平相对地来看:水平相对地来看:高高值值被被高高值值包包围围的的高高-高高集集聚聚省省份份有有:北北京京、天天津津、河河南南、安安徽徽、
19、湖湖北北、江江西西、海海南南、广广东东、福福建建、浙浙江、山东、上海、江苏;江、山东、上海、江苏;低低值值被被低低值值包包围围的的低低-低低集集聚聚省省份份有有:黑黑龙龙江江、内内蒙蒙古古、新新疆疆、吉吉林林、甘甘肃肃、山山西西、陕陕西西、青青海海、西西藏、四川、云南、辽宁、贵州;藏、四川、云南、辽宁、贵州;被被低低值值包包围围的的高高值值省省份份有有:重重庆庆、广广西西、河河北北;被被高值包围的高值包围的低值低值省份只有湖南。省份只有湖南。第28页/共39页(二)第29页/共39页第30页/共39页第31页/共39页第32页/共39页第33页/共39页第34页/共39页三、软件实现三、软件实
20、现空间统计分析,目前比较流行的计算软件主要有Asellin等人编写的Space Stat、Geodata等,随着ARCGIS的发展,一些空间统计模块中也嵌套了类似的计算功能,如在ARC/INFO的工作空间WORKSPACE环境,其中的GRID模块中,可以调用命令MORAN来实现全局空间自相关指数,当然这主要是针对栅格数据的计算,对于一些其他格式的数据,可以通过数据的交互格式来转换。另一方面,弄清楚空间统计分析的基本原理之后,也可以自己用Matlab编程来实现其计算过程。第35页/共39页实例利用Geodata 9.0来进行空间自相关分析以黄河流域各个地市的人均GDP空间自相关分析为例第36页/共39页第37页/共39页第38页/共39页感谢您的观看!第39页/共39页