《空间统计分析方法ppt课件.ppt》由会员分享,可在线阅读,更多相关《空间统计分析方法ppt课件.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物第第5讲讲 空间统计分析空间统计分析授课人:王 杰Email: 安徽大学 资源与环境工程学院地理信息系统科研方法课程我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物本讲内容本讲内容探索性空间统计分析探索性空间统计分析地统计分析方法地统计分析方法 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活
2、的生物空间统计分析空间统计分析, ,即空间数据(即空间数据(spatial data)的统)的统计分析,是现代计量地理学中一个快速发展的方向计分析,是现代计量地理学中一个快速发展的方向和领域。和领域。空间统计分析,其核心就是认识与地理位置相关的空间统计分析,其核心就是认识与地理位置相关的数据间的数据间的空间依赖、空间关联或空间自相关空间依赖、空间关联或空间自相关,通过,通过空间位置建立数据间的统计关系。空间位置建立数据间的统计关系。空间统计分析的任务,就是运用有关统计方法,建空间统计分析的任务,就是运用有关统计方法,建立立空间统计模型空间统计模型,从凌乱的数据中,从凌乱的数据中挖掘空间自相关挖
3、掘空间自相关与空间变异规律与空间变异规律。 空间统计分析空间统计分析我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物空间数据分析与传统统计分析主要有空间数据分析与传统统计分析主要有两大差异:两大差异:(1)空间数据间并非空间数据间并非独立独立,而是在维空间中具有某种空间相关,而是在维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同之相关程度;性,且在不同的空间分辨率下呈现不同之相关程度;(2)地球只有一个,大多数空间问题仅有一组(空间分布不规地球只有一个,大多数空间问题仅有一组(空间分布不规则的)观
4、测值,而则的)观测值,而无重复观测数据无重复观测数据。因此,空间现象的了。因此,空间现象的了解与描述是极为复杂的,而传统方法,尤其是建立在独立解与描述是极为复杂的,而传统方法,尤其是建立在独立样本上的统计方法,不适合分析空间数据。样本上的统计方法,不适合分析空间数据。空间统计空间统计 VS. 经典统计经典统计n 经典统计:独立性、随机性假设经典统计:独立性、随机性假设n 空间统计:自相关、依赖性、异质性空间统计:自相关、依赖性、异质性我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物地理学第一定律(地理学第一
5、定律(FLGFLG): :空间统计的基本思想:Waldo Tobler(born in 1930) receiving a plaque for his contributions to geography. On the event of his November 2000 birthday. http:/en.wikipedia.org/wiki/Waldo_R._Tobler Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. Economic Geography, 4
6、6(2): 234-240.FLGFLG的一般性的一般性: : 自然地理、人文地理、社会经济我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n 空间自空间自相关相关是普遍存在的是普遍存在的,否则地理分析便没有多大意义。 经典统计:独立 空间自相关的存在,使得经典统计学所要求的样本独立性假设不满足。n 如果地理学从根本上值得研究,必然是因为地理现象在空间上的变化地理现象在空间上的变化不是随机不是随机的的。 经典统计:随机我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到
7、愉快,证实我的猜测没有错:表里边有一个活的生物 可以借助空间统计更好地理解地理现象。可以借助空间统计更好地理解地理现象。 或许学习空间统计最重要的原因是我们不仅仅想知道问题或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么怎么样样”,更想知道,更想知道“哪里怎么样哪里怎么样” 空间统计学可以帮助我们准确地判断具体地理模空间统计学可以帮助我们准确地判断具体地理模式的原因。式的原因。 John Snow的霍乱地图的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可能是病源。能是病源。 空间统计学可以帮助我们处理大的复杂数
8、据集空间统计学可以帮助我们处理大的复杂数据集, 这是这是GIS经常面对的事情。经常面对的事情。为什么要用空间统计为什么要用空间统计我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物霍乱病死者居住分布图(John Snow, 1854)v 18541854年年8 8月到月到9 9月月英国伦敦霍乱流英国伦敦霍乱流行时,当局始终找不到发病的原行时,当局始终找不到发病的原因,后来医生约翰因,后来医生约翰斯诺斯诺(John (John Snow) Snow) 参与调查。参与调查。v 他在绘有霍乱流行地区所有道路、他在绘
9、有霍乱流行地区所有道路、房屋、饮用水机井等内容的房屋、饮用水机井等内容的1 1:65006500比例尺地图上,标出了每个比例尺地图上,标出了每个霍乱病死者的霍乱病死者的居住位置居住位置,得到了,得到了霍乱病死者居住分布图霍乱病死者居住分布图。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物一一. 探索性空间统计分析探索性空间统计分析 基本原理与方法 应用实例 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物探索性空间数据
10、分析探索性空间数据分析(ESDA)ESDA是指利用统计学原理统计学原理和图形图表图形图表相结合对空间信息的性质进行分析、鉴别,用以引导确定性模型的结构和解法。 ESDA与EDA区别在于它考虑了数据的空间特性,它考虑了数据的空间特性,在方法上它将数据分解为一般趋势和叠加于其上的在方法上它将数据分解为一般趋势和叠加于其上的局部变化两部分局部变化两部分。然后用一定的数学函数去拟合由样本点产生的经验变率函数,进行诸如克立格内插等空间操作。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 通常定义一个二元对称空间权重
11、矩阵W,来表达n个位置的空间区域的邻近关系,其形式如下式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。 1. 基本原理与方法基本原理与方法 (一)空间权重矩阵 nnnnnnwwwwwwwwwW212222111211我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 简单的二进制邻接矩阵简单的二进制邻接矩阵 基于距离的二进制空间权重矩阵基于距离的二进制空间权重矩阵 n两种最常用的确定空间权重矩阵的规则 其他相邻接和当区域01jiwij其他时的距离小于和当区域01djiwij我吓了一跳
12、,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(二)全局空间自相关(二)全局空间自相关 Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。 Geary 系数与Moran指数存在负相关关系。 Patrick A.P.Moran (1917-1988) Moran指数和Geary系数是两个用来度量空间自相关的全局指标。 全局空间自相关概括了在一个总的空间范围内空间依赖的程度。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个
13、活的生物 如果是位置(区域)的观测值,则该变量的全局Moran指数I,用如下公式计算 式中: I 为Moran指数; ninjniiijninjjiijxxwxxxxwnI111211ninijijninijjiijwSxxxxw121)(22)(1iixxnSniixnx11;。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 Geary 系数C计算公式如下 式中:C为Geary系数;其他变量同上式。 如果引入记号 ninjniiijninjjiijxxwxxwnC111211221ninjijwS110
14、)(xxzii)(xxzjj,21nTzzzz我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 则全局Moran指数I的计算公式也可以进一步写成 Moran指数指数I的取值一般在的取值一般在-1,1之间之间,小于小于0表示负相表示负相关,等于关,等于0表示不相关,大于表示不相关,大于0表示正相关;表示正相关; Geary系数系数C的取值一般在的取值一般在0,2之间,大于之间,大于1表示负表示负相关,等于相关,等于1表示不相关,而小于表示不相关,而小于1表示正相关。表示正相关。 niininjjiijxxxx
15、xxwSnI12110)()(zzWzzSnzzzwSnTTniininjjiij012110我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 (三)局部空间自相关(三)局部空间自相关 描述一个空间单元与其领域的相似程度,能够表示每个局部单元服从全局总趋势的程度(包括方向和量级),反映了空间异质性,说明空间依赖是如何随位置变化的。 局部空间自相关分析方法包括局部空间自相关分析方法包括3种种:p 空间联系的局部指标空间联系的局部指标(LISA); p G统计量统计量;p Moran散点图散点图我吓了一跳,蝎子
16、是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n空间联系的局部指标空间联系的局部指标(LISA)(LISA) 空间联系的局部指标(空间联系的局部指标(local indicators of spatial association ,缩写为,缩写为LISA)满足下列两个条件:)满足下列两个条件: (1)每个区域单元的)每个区域单元的LISA,是,是描述该区域单元周围描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标显著的相似值区域单元之间空间集聚程度的指标; (2)所有区域单元)所有区域单元LISA的总和与全局的
17、空间联系指的总和与全局的空间联系指标成比例。标成比例。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 LISA包括包括局部局部Moran指数指数(local Moran index)和和局部局部Geary指数指数(local Geary index),下面重),下面重点介绍和讨论局部点介绍和讨论局部Moran指数。指数。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 局部局部Moran指数被定义为指数被定义为可进一步
18、写成可进一步写成 式中:式中: 和和 是经过标准差标准化的观测值。是经过标准差标准化的观测值。 局部局部Moran指数检验的标准化统计量为指数检验的标准化统计量为 jjijiixxwSxxI)()(2iijjijiixxxxwxxnI2)()()(jjijiTjjijizwzzzzwnzizjz)()()(iiiiIVARIEIIZ我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n G统计量统计量 v 全局全局G统计量的计算公式为统计量的计算公式为v 对每一个区域单元的统计量为对每一个区域单元的统计量为 i
19、jijjijiijxxxxwG/ijjjijixxwG/ 探测区域单元是属于高值集聚还是低值集聚的空探测区域单元是属于高值集聚还是低值集聚的空间分布模式间分布模式. .我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 对统计量的检验与局部对统计量的检验与局部Moran指数相似,其检验值为指数相似,其检验值为 显著的正值表示在该区域单元周围,高观测值的区域单显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于
20、空间集聚于空间集聚, ,与与Moran指数只能发现相似值指数只能发现相似值( (正关联正关联) )或非相似或非相似性观测值性观测值( (负关联负关联) )的空间集聚模式相比,的空间集聚模式相比,具有能够探测出区具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式域单元属于高值集聚还是低值集聚的空间分布模式。)()()(iiiiGVARGEGGZ我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n Moran散点图散点图 以(以(Wz,z)为坐标点的为坐标点的Moran散点图,常来研究局部的散点图,常来
21、研究局部的空间不稳定性,它对空间滞后因子空间不稳定性,它对空间滞后因子Wz和和z数据对进行了可视数据对进行了可视化的二维图示。化的二维图示。 全局全局Moran指数,可以看作是指数,可以看作是Wz对于对于z的线性回归系数,的线性回归系数,对界外值以及对对界外值以及对Moran指数具有强烈影响的区域单元,可通指数具有强烈影响的区域单元,可通过标准回归来诊断出。过标准回归来诊断出。 由于数据对(由于数据对(Wz,z)经过了标准化,因此界外值可易由)经过了标准化,因此界外值可易由2sigma规则可视化地识别出来。规则可视化地识别出来。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽
22、的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 Moran散点图的散点图的4 4个象限个象限,分别对应于区域单元与其邻居分别对应于区域单元与其邻居之间之间4 4种类型的局部空间联系种类型的局部空间联系形式:形式:l 第第1 1象限代表了象限代表了高观测值高观测值的的区域单元被区域单元被高值高值的区域所包围的区域所包围的空间联系形式;的空间联系形式;l 第第2 2象限代表了象限代表了低观测值低观测值的的区域单元被区域单元被高值高值的区域所包围的区域所包围的空间联系形式;的空间联系形式;我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感
23、到愉快,证实我的猜测没有错:表里边有一个活的生物 l 第第3 3象限代表了象限代表了低观测值低观测值的区域单元被的区域单元被低值低值的区域所的区域所包围的空间联系形式;包围的空间联系形式;l 第第4 4象限代表了象限代表了高观测值高观测值的区域单元被的区域单元被低值低值的区域所的区域所包围的空间联系形式。包围的空间联系形式。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2. 应用实例应用实例 中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵
24、,选取各省(直辖市、自治区)19982002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。年份年份IZP19980.50014.503 50.000 019990.506 94.555 10.000 020000.511 24.597 80.000 020010.505 94.553 20.000 020020.501 34.532 60.000 0我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 从表从表中中可以看出,在可以看出,在199820
25、02年期间,中国大陆年期间,中国大陆30个个省级行政区人均省级行政区人均GDP的全局的全局Moran指数均为正值;在正态指数均为正值;在正态分布假设之上,对分布假设之上,对Moran指数检验的结果也高度显著。这就指数检验的结果也高度显著。这就是说,在是说,在19982002年期间,中国大陆年期间,中国大陆30个省级行政区人均个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省存在着显著的、正的空间自相关,也就是说各省级行级行政区政区人均人均GDP水平的空间分布表现出相似值之间的空间集水平的空间分布表现出相似值之间的空间集聚,其空间联系的特征是:较高人均聚,其空间联系的特征是:较高人
26、均GDP水平的省级行政水平的省级行政区相对地趋于和较高人均区相对地趋于和较高人均GDP水平的省水平的省级行政区级行政区相邻,或相邻,或者较低人均者较低人均GDP水平的水平的省级行政区省级行政区相对地趋于和较低人均相对地趋于和较低人均GDP水平的水平的省级行政区省级行政区相邻。相邻。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这
27、样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 东部的江苏、上海、浙江三省市的Z值在0.05的显著性
28、水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 以(Wz,z)为坐标,进一步绘制Moran散点图 可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。我吓了一跳,蝎子是多么丑恶和恐
29、怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看: 高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏; 低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州; 被低值包围
30、的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1978、1990、2001、2007年全国各省市人均GDP的LISA显著水平图我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物二、地统计分析方法二、地统计分析方法地统计方法的基本原理 应用实例 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没
31、有错:表里边有一个活的生物 地统计学地统计学(Geostatistics), 又称地质统计学,是法国著名统计学又称地质统计学,是法国著名统计学家家G.Matheron在大量理论研究基础上提出的。在大量理论研究基础上提出的。 地统计学是以地统计学是以区域化变量理论区域化变量理论为基础,以变异函数为主要工为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性,或空间格局与变异,并对这些数据进行最优相关和依赖性,或空间格局与变异,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性。无偏内插估计,或模
32、拟这些数据的离散性、波动性。 协方差函数协方差函数和和变异函数变异函数是以区域化变量理论为基础建立起来是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析基础之上的。克立格法就是建立在变异函数理论和结构分析基础之上的。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 当一个变量当一个变量呈现为空间分布呈现为空间分布时,就称之为区域化变量。这种变时,就称之为区域化变量。这种变量常常
33、反映某种空间现象的特征,用区域化变量来描述的现象称之量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为为区域化现象区域化现象。 区域化变量区域化变量,亦称,亦称区域化随机变量区域化随机变量,G. Matheron(1963)将)将它定义为以空间点它定义为以空间点x的三个直角坐标为自变量的随机场的三个直角坐标为自变量的随机场 区域化变量具有区域化变量具有两个最显著两个最显著,而且也是最重要的特征,即,而且也是最重要的特征,即随机随机性和结构性性和结构性。1. 地统计方法的基本原理地统计方法的基本原理 (一)区域化变量 ),(wvxxxZZux我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什
34、么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物区域化变量的功能:区域化变量的功能:由于区域化变量是一种随机函数,因而能同时反映空间变量的结构性和随机性。l一方面,当空间点 x 固定后,Z(x)就是一个随机变量,这体现了其随机性随机性。l另一方面,在空间两个不同点 x 与 x+h 处的区域化变量值具有某种程度的相关性,这体现了其结构性结构性。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物区域化变量的组成部分区域化变量的组成部分l 数据点 结构性 可以用均值和常数
35、趋势表示 空间相关 数据通常呈现正空间相关性 随机性 测量误差,其他误差 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物distance elevation结构性结构性随机性随机性实际值实际值我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(二)协方差函数(二)协方差函数 协方差函数的概念协方差函数的概念 区域化随机变量之间的差异,可以用空间协方差来表示。区域化随机变量之间的差异,可以用空间协方差来表示。 在概率论中在
36、概率论中,随机向量随机向量X与与Y的协方差被定义为的协方差被定义为 区域化变量区域化变量 在空间点在空间点x和和x+h处的两个随机处的两个随机变量和的二阶混合中心矩定义为变量和的二阶混合中心矩定义为Z(x)的自协方差函数,即的自协方差函数,即),()(wvuxxxZxZ)()()()()(),(hxZExZEhxZxZEhxZxZCov(4.2.24.2.2))(),(EyyExxEyxcov(4.2.1)(4.2.1)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n协方差函数的计算公式协方差函数的计算公
37、式 式中:式中:h h为两样本点空间分隔距离或距离滞后;为两样本点空间分隔距离或距离滞后; 为为 在空间位置在空间位置 处的实测值;处的实测值; 是是 在在 处距离偏离处距离偏离h的实测值的实测值 i=1=1,2 2, , 是分隔距离为是分隔距离为h时的样本点对(时的样本点对(parisparis)总数,)总数, 和和 分别为分别为 和和 的样本平均数的样本平均数, ,即即 ix)(1)()()()()(1)(hNiiiiihxZhxZxZxZhNhc)(xZ)(hxZi)(xZ)(hN)(ixZ)(hxZi)(ixZ)(hxZi(4.2.3)(4.2.3)NiiixZNxZ1)(1)()(i
38、xZNiiihxZNhxZ1)(1)(4.2.4)(4.2.4)(4.2.5)(4.2.5)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 若若 = =m(常数),则上式可以改写为(常数),则上式可以改写为 式中:式中:m为样本平均数,可由一般算术平均数公式求得,即为样本平均数,可由一般算术平均数公式求得,即 )(ixZ)(hxZi)(12)()()(1)(hNiiimhxZxZhNhcniixZNm1)(1(4.2.6)(4.2.6)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世
39、界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(三)变异函数(三)变异函数 变异函数的概念变异函数的概念 变异函数变异函数(variograms),又称变差函数、变异矩,是地统计,又称变差函数、变异矩,是地统计分析所特有的基本工具。分析所特有的基本工具。 在一维条件下变异函数定义为,在一维条件下变异函数定义为,当空间点当空间点x在一维在一维x轴上变轴上变化时,区域化变量化时,区域化变量Z(x)在点在点x和和x+h处的值处的值Z(x)与与Z(x+h)差的方差的方差的一半为区域化变量差的一半为区域化变量Z(x)在在x轴方向上的变异函数轴方向上的变异函数,记为,记为(h),即即
40、)()(21),(hxZxZVarhx22)()(21)()(21hxZExZEhxZxZE(4.2.7)(4.2.7)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 在在二阶平稳假设二阶平稳假设条件下,对任意的条件下,对任意的h有有 因此,公式可以改写为因此,公式可以改写为 从上式可知,变异函数依赖于两个自变量从上式可知,变异函数依赖于两个自变量 x和和h,当变异函,当变异函数数 仅仅依赖于距离仅仅依赖于距离h h而与位置而与位置x无关时,无关时, 可改写可改写成成 ,即,即 )()(xZEhxZE2)
41、()(21),(hxZxZEhx),(hx)(h),(hx2)()(21)(hxZxZEh(4.2.9)(4.2.9)(4.2.8)(4.2.8)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物变异函数的性质变异函数的性质 设设Z(x)是区域化变量,在满足二阶平稳假设条件下,变异函是区域化变量,在满足二阶平稳假设条件下,变异函数式具有如下性质:数式具有如下性质: (1)(1) =0 =0,即在,即在h=0=0处,变异函数为处,变异函数为0 0; (2(2) = ) = ,即,即 关于直线关于直线h=0=0是
42、对称的,它是一个偶函是对称的,它是一个偶函数;数; (3) 0(3) 0,即,即 只能大于或等于只能大于或等于0 0;)0()( h)(h)(h)( h)(h我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n变异函数的计算公式 v 设设 是系统某属性是系统某属性Z在空间位置在空间位置x处的值,处的值, 为一区为一区域化随机变量,并满足二阶平稳假设,域化随机变量,并满足二阶平稳假设,h为两样本点空间为两样本点空间分隔距离,分隔距离,v 和和 分别是区域化变量分别是区域化变量 在空间位置在空间位置 和和 处的实
43、测值处的实测值i=1,2,N(h),那么,变异函数,那么,变异函数 的离散计的离散计算公式为算公式为)(xZ)(xZ)(ixZ)(hxZiix)(xZhxi)(h)(12)()()(21)(hNiiihxZxZhNh(4.2.10)(4.2.10)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 这样对不同的空间分隔距离这样对不同的空间分隔距离h,计算出相应的,计算出相应的 和和 值。值。如果分别以如果分别以h为横坐标,为横坐标, 或或 为纵坐标,画出协方差函数和为纵坐标,画出协方差函数和变异函数曲线图,就
44、可以直接展示区域化变量变异函数曲线图,就可以直接展示区域化变量Z(x)的空间变异特的空间变异特点。可见,变异函数能同时描述区域化变量的随机性和结构性,点。可见,变异函数能同时描述区域化变量的随机性和结构性,从而在数学上对区域化变量进行严格分析,是空间变异规律分析从而在数学上对区域化变量进行严格分析,是空间变异规律分析和空间结构分析的有效工具。和空间结构分析的有效工具。)(hc)(h)(hc)(h我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽
45、的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物例如:假设某地区降水量Z(x)(单位:mm)是二维区域化随机变量,满足二阶平稳假设,其观测值的空间正方形网格数据如图4.2.1所示(点与点之间的距离为h=1 km)。试计算其南北方向及西北和东南方向的变异函数。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图图4.2.1 4.2.1 空间正方形网格数据(点间距空间正方形网格数据(点间距h h=1 km=1 km) 从图4.2.1可以看出,空间上有些点,由于某种原因没有采集到。如果没有缺失
46、值,可直接对正方形网格数据结构计算变异函数;在有缺失值的情况下,也可以计算变异函数。只要“跳过”缺失点位置即可(图4.2.2)。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图图4.2.2 4.2.2 缺失值情况下样本数对的组成和计算过程缺失值情况下样本数对的组成和计算过程为缺失值 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图图1 空间正方形网格数据(点间距空间正方形网格数据(点间距h=1km) 我吓了一跳,蝎子
47、是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图图2 空间正方形网格数据(点间距空间正方形网格数据(点间距h=2km) 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 首先计算南北方向上的变异函数值,由变异函数的计算公式可得 =385/72=5.35 图图4.2.2 4.2.2 缺失值情况下样本数对的组成和计算过程缺失值情况下样本数对的组成和计算过程为缺失值 222222)3837()3836()3635()3537()3742()
48、4240(3621) 1 (222222)4242()3536()3743()4340()3735()3538(222222)3738()3839()3940(3535)3535()3542()(222222)3336()3637()3739()3939()3034()3437(222222)4036()2932()3236()3637()3741()4137()3228()3438()3029()2935()3533()3340(222222我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 同样计算出 最
49、后,得到南北方向和西北东南方向上的变异函数计算结果见下表。同样可以计算东西方向上的变异函数。 9.26)2(17.55)3(25.69)4(22.90)5( 方向 南北 方向 西北东南 h12345h1.412.824.245.657.07N(h) 36 27 21 13 5 N(h) 322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00)(h)(h我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n变异函数的参数 变异函数有变异函数有4个非常重要的参
50、数,即个非常重要的参数,即基台值(基台值(sill)、变变程(程(range)或称空间依赖范围(或称空间依赖范围(range of spatial dependence)、)、块金值(块金值(nugget)或称区域不连续性值或称区域不连续性值(localized discontinuity)和)和分维数(分维数(fractal dimension)。 前前3个参数可以直接从变异函数图中得到。它们决定变个参数可以直接从变异函数图中得到。它们决定变异函数的形状与结构。异函数的形状与结构。 变异函数的形状反映自然现象空间分布结构或空间相变异函数的形状反映自然现象空间分布结构或空间相关的类型,同时还能