《城市信息系统(第9讲).pptx》由会员分享,可在线阅读,更多相关《城市信息系统(第9讲).pptx(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、河南大学环境与规划学院主讲教师:王海鹰主讲教师:王海鹰第九讲第九讲空间分析模型空间分析模型l复杂空间分析(空间统计分析)l空间分析建模(适宜性分析)空间分析模型空间分析模型复杂空间分析复杂空间分析n空间统计分析概念:即空间数据的统计分析,通过空间位置建立数据间的统计关系。含义:“空间数据的统计分析”及“数据的空间统计分析”。前者着重于空间物体和现象的非空间特性的统计分析,以数学统计模型来描述和模拟空间现象和过程,空间数据所描述的事物的空间位置在这些分析中不起制约作用,在很多方面与一般的数据分析并无本质差别。但是对空间数据的统计分析结果的解释则必然要依托于地理空间进行,以地图形式来表达。后者直接
2、从空间物体的空间位置、联系等方面出发,研究既具有随机性和结构性,或具有空间相关性和依赖性的自然现象。既考虑到样本值的大小,又重视样本空间位置及样本间的距离。数据的空间统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离。空间数据具有空间依赖性(空间自相关)和空间非均质性(空间结构),扭曲了经典统计方法的假设条件,使得经典统计模型对空间数据的分析会产生虚假的解释。复杂空间分析复杂空间分析n空间统计分析产生原因:大多数经典统计学分析要求样本相互独立,而空间数据间并非完全独立,而是存在依赖性。空间统计分析的目的:描述事物在空间上的分布特征(随机的、聚集的或规则的)。分析数据的空间自相关性,空
3、间自相关性对空间格局的影响,如何利用这种关系构建模型。复杂空间分析复杂空间分析n空间统计分析1、基本统计量2、探索性数据分析复杂空间分析复杂空间分析n1、基本统计量基本统计量集中趋势离散程度分布特征平均数中位数众数分位数极差离差平均离差离差平方和方差标准差变异系数偏度峰度总和比率比例种类描述数据特征的统计量其他统计量这些统计量反映了数据集的范围、集中情况、离散程度、空间分布等特征,对进一步的数据分析起着铺垫作用复杂空间分析复杂空间分析n空间统计分析1、基本统计量2、探索性数据分析3、分级统计分析4、空间插值5、空间回归分析 是20世纪后半期在西方统计界兴起的一种统计分析方法,其基本思想是“让数
4、据说话”,即先分析数据再建立模型。是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。特别是当我们对这些数据中的信息没有足够的经验,不知道该用何种传统统计方法进行分析时,探索性数据分析就会非常有效。复杂空间分析复杂空间分析n2、探索性空间数据分析(Exploratory Spatial Data Analysis)(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spati
5、al Data Analysis)1)直方图2)QQplot分布图3)变异函数4)Voronoi图复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)(一)基本分析工具1)直方图直方图是一种适用于对大量样本点进行整理加工,找出其数据分布的规律和形态,以便对其总体分布特征进行推断的方法。是指对采样数据按一定的分级方案(等间隔分级、标准差分等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图可以直观的反映采样数据分布特征、总体规律,可以用来检验数据分布和寻找数据离群值。它包括两个重要参数
6、:频率分布和概括性的统计指标。对采样数据按一定的分级方案进行分级,统计采样点落入各个级别中的个数,并通过条带图或柱状图表现出来。频率分布频率分布统计指标统计指标2)QQplo图正态QQPlot分布图(normal QQplot):主要用来评估具有n个值的单变量样本数据是否服从正态分布。如果数据越接近一条直线,则它越接近于服从正态分布。如果有个别采样点偏离直线太多,那么这些采样点可能是一些异常点,应对其进行检验。此外,如果在正态QQ图中没有显示出正态分布,那么就有必要在应用某种插值法之前,将数据进行转换(如对数转换等),使之服从正态分布。河南省18个地级市2010年人均GDP Q-Q图2)QQp
7、lo图普通QQPlot分布图(general QQplot):主要用来评估两个数据集分布的相似性。提示了两个变量之间的相关关系,如果在Qqplot图中曲线呈直线,说明两物体呈一种线性关系,可以用一元一次方程式来拟合。如果呈抛物线,说明两物体的关系可以用个二次多项式来拟合。河南省18个地级市2010年人均GDP与第三产业比值 普通Q-Q图半变异函数:半变异函数把统计相关系数的大小作为一个距离的函数,是地理学相近相似定理的定量化。半变异值随着距离的加大而增加,反映了一个采样点与其相邻采样点的空间关系。对异常采样点具有很好的探测作用。3)半变异函数3)半变异函数半变异函数:半变异函数把统计相关系数的
8、大小作为一个距离的函数,是地理学相近相似定理的定量化。半变异值随着距离的加大而增加,反映了一个采样点与其相邻采样点的空间关系。参数含义:块金值(Nugget):理论上,当采样点间的距离为0时,半变异函数值应为0,但由于存在测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为0,即存在块金值。变程(Range):当半变异函数的取值由初始的块金值达到基台值时,采样点的间隔距离称为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度的限定。在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当hR时,区域化变量Z(x)的空间相关性不存在,即当某点与已知点的距
9、离大于变程时,该点数据不能用于内插或外推。偏基台值(Partial Sill):基台值与块金值的差值。基台值(Sill):当采样点间的距离h增大时,半变异函数r(h)从初始的块金值达到一个相对稳定的常数时,该常数值称为基台值。当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不存在。3)半变异函数3)半变异函数只有数据空间相关,才有必要进行空间插值。图表的横坐标表示任两点的空间距离,纵标表示该两点的半变异函数值。根据距离越近越相似的原理,因而x值越小,y值应该越小。4)Voronoi图 由俄国数学家M.G.Voronoi 于1908年发现并以他的名字命名的。1911 年
10、荷兰气候学Thiessen为提高大面积气象预报的准确度,应用VorM.Gonoi 图对气象观测站进行了有效区域划分。因此在二维空间中,Voronoi 图也称为泰森多边形。是由在样点周围形成的一系列多边形组成的。某点所在的多边形内任何位置到该点的距离都比该多边形到其他样点的距离要近。可以了解每个采样点控制的区域范围,从而体现出每个采样点对区域内插的重要性。通过该图可以识别出样点中的局部离群值。4)Voronoi4)Voronoi图图4)Voronoi图4 4)Voronoi图Voronoi图的定的定义:平面n个离散点,把平面分成n个区,每个区包括一个点,该点所在的区是到该点距离最近的点的集合。4
11、)Voronoi图Voronoi图的特点:1 组成多边形的边总是与两相邻样点的连线垂直;2 多边形内的任意位置总是离该多边形内样点的距 离最近,离相邻多边形内样点距离远;3 每个多边形内包含且仅包含一个样点。熵(entropy)Voronoi图(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)1)用直方图检测数据的分布2)用Normal QQplot图检测数据分布复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spa
12、tial Data Analysis)(二)检验数据分布 在地统计分析中,克里格方法是建立在平稳假设的基础上,这种假设在一定程度上要求所有数据值具有相同的变异性。另外,一些克里格插值都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,检验数据分布特征,了解和认识数据具有非常重要的意义。数据的检验可以通过直方图和正态QQPlot分布图完成(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)(三)
13、寻找数据离群值 在一组平行测定数据中,有时会出现个别值与其他值相差较远,这种值叫离群值。数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很高或很低的值的观测样点。局部离群值值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,它又偏高或偏低。复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)1)利用直方图查找离群值2)利用半变异函数云识别离群值3)利用Voronoi图查找局部离群值1)利用直方图查找离群值 离群值在直方图上表现为孤立存在或被一群显著不同的值包围,直方图上最右边被
14、选中的一个柱状条即是该数据的离群值,相应地,数据点层面上对应的样点也被刷光。但需注意的是,在直方图中孤立存在或被一群显著不同的值包围的样点不一定是离群值。离群值的直方图查找和图面显示2)用半变异函数云识别离群值 如果数据集中有一个异常高值的离群值,则与这个离群值形成的样点对,无论距离远近,在半变异函数云图中都具有很高的值。如下图所示,这些点可大致分为上下两层,对于上层的点,无论位于横坐标的左端或右端(即无论距离远近)都具有较高的值。刷光上层的一些点,右图是对应刷光的样点对。可以看到,这些高值都是由同一个离群值的样点对引起的,因此,需要对该点进行剔除或改正。离群值的半变异/协方差函数云查找和图面
15、显示3)用Voronoi图查找局部离群值用聚类和熵的方法生成的Voronoi图可用来帮助识别可能的离群值。熵值是量度相邻单元相异性的指标。通常,距离近的事物比距离远的事物具有更大的相似性。因此,局部离群值可以通过高熵值的区域识别出来。同样的原理,聚类方法也可将那些与它们周围单元不相同的单元识别出来。熵(entropy)Voronoi图聚类(cluster)Voronoi图(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)空间趋势反映了空间
16、物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)(四)全局趋势分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)(四)全局趋势分析趋势分析透视图(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Explora
17、tory Spatial Data Analysis)(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)n空间自相关(Spatial autocorrelation)是指同一个变量在不同空间位置上的相关性。大部分的地理现象都具有空间相关特性,即距离越近的两事物越相似。地理研究对象普遍存在的变量间的关系中,确定性的是函数关系,非确定性的是相关关系。如果存在空间自相关,那么该变量本身存在某种数学模型。半变异/协方差函数云图就是这种关系的定量化表示。n目的在于检验空间单元与其相邻的空间单元的属性间是否具相似性。n如何
18、定义“相邻”?空间权重矩阵(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)(五)空间自相关分析复杂空间分析复杂空间分析n2、探索性数据分析(Exploratory Spatial Data Analysis)n空间自相关分析可分以下 3个过程:1)首先建立空间权重矩阵,以明确研究对象在空间位置上的相互关系;2)其次进行全局空间自相关分析,判断整个区域是否存在空间自相关现象或集聚现象;3)最后进行局部空间自相关分析,找出空间自相关现象存在的局部区域。n地理事物在空间上的此起彼伏和相互影响是通过它们之间的相互联系
19、得以实现的,空间权重矩阵是传载这一作用过程的实现方法。因此,构建空间权重矩阵是研究空间自相关的基本前提之一。空间数据中隐含的拓扑信息提供了空间邻近的基本度量。n通常定义一个二元对称空间权重矩阵Wnn来表达n个空间对象的空间邻近关系,可根据邻接标准或距离标准来度量,还可以根据属性值xj和二元空间权重矩阵来定义一个加权空间邻近度量方法。1)空间权重矩阵 n通常定义一个二元对称空间权重矩阵,来表达个位置的空间区域的邻近关系,其形式如下:式中:Wij表示区域i与j的邻近关系。n权重的确定主要依据地理特征,如地区边界和距离等,这样可以保证空间权重矩阵的外生性。它可以根据多边形邻接标准或距离邻接标准来度量
20、。n表示n个区域单元。1)空间权重矩阵 a)简单的二进制邻接矩阵b)基于距离的二进制空间权重矩阵 1)空间权重矩阵 c)加权空间邻近矩阵1)空间权重矩阵(1)Morans I 设研究区域中存在n个面积单元,第i个单元上的观测值记为xi,观测变量在n个单元中的均值记为 ,Morans I定义为:2)空间自相关系数 -1 I 11表示极强的正空间自相关,-1表示极强的负空间自相关。a)Morans I 对于Moran指数,可以用莫兰指数显著性检验的公式来检验n个区域是否存在空间自相关关系,Z的计算公式为:2)空间自相关系数a)Morans I当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布,如高值与低值的观测值集聚;当Z值为零时,观测值呈独立随机分布。检验是否显著,可以通过查标准正态分布表计算z的p值,再将它与显著性水平进行比较。一般来说,z1.96,则在0.05水平上显著;z1.64,则在0.1水平上显著。b)Geary 系数C 基于相关位置间的数字差分:Geary系数C的取值一般在02之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。2)空间自相关系数C l i c k t o e d i t c o m p a n y s l o g a n .