《中国科学院大学空间分析复习资料(共8页).docx》由会员分享,可在线阅读,更多相关《中国科学院大学空间分析复习资料(共8页).docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上一、 名词解释1 估计方差:估计方差是指估计误差的离散程度。估计方差越大,估计误差的离散程度越大。估计误差是指实测值与承载真实值之间的误差。若实测值为:承载真实值为:。则估计误差为:2 随机函数:假设一个样本空间,对于每一个样本都有一个函数与之对应,其中则称为定义在 上的随机函数。3 地理可达性(Geographic Accessibility):Accessibility refers to the relative ease by which the locations of activities, such as work, shopping, and heal
2、th care, can be reached from a given location (BTS, 1997)(马)地理可达性是指由一个给定的地点到工作、交通、购物、卫生保健等场所的容易程度。它是研究评价各种服务设施布局及其服务域的重要指标之一,空间距离、交通便捷性、出行成本等是可达性测度的重要因子。(文献)指某一地点到达其他地点、或其他地点到达这一地点的便利程度,是一种对点与线、点与点地理要素进行空间关系分析的过程。其度量指标为个体与其欲到达的兴趣点之间的距离以及不同兴趣点对个体的潜在吸引力规模。(空间可达性,地信B)4 掩膜图层(Mask):预先定义好在一个栅格图层中,哪个区域或哪些像
3、元参与或不参与运算(宋)用选定的图像、图形或物体,对处理的图像(全部或局部)进行遮挡,来控制图像处理的区域或处理过程(百度)5 不规则三角网(TIN,Triangulated Irregular Network):用一组互不重叠的三角形来近似表示地形或曲面的矢量数据格式。通常TIN由点图层生成,每个点都与其最邻近点连接,且三角形尽量密集排列的原则,有时TIN还可以增加线等约束条件。(宋)6 地理案例:地理案例地理案例,它发生在特定的地理空间,且案例受区域分异规律的影响呈现随空间位置变化而变化的特征。它的首要条件是发生在特定案例空间地理空间,其次它的必要条件为空间位置是最终引起案例间本质区别的因
4、素。(杜)二、 简答题1 列出几种常用的空间自回归模型,并简单说明其原理。 AICc用来评价模型好坏,越小越好 空间自回归:不仅考虑了因变量Y与自变量X之间的关系,还引入邻居因变量Y变化。有两种思想Simultaneous Autoregressive(SAR),more globally;Conditional Autoregressive (CAR),more locally.(1) 简单线性模型:在统计学中,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。一个带有一个自变量的线性回
5、归方程代表一条直线。我们需要对线性回归结果进行统计分析。 其实就是最简单的线性回归方程,grobal版, ppt上的例子AICc=382.7(2) 滞后模型(lag model):在线性模型基础上加上了Y与周围Y的关系(周围Y乘上了一个权重),ppt上的例子AICc=376.3(3)误差模型(error model):基本模型与简单线性模型相似,不过在误差中引入邻居误差的影响(即对误差进行空间自回归), ppt上的例子AICc=378.3(4)SAC模型(SAC model ):是滞后模型和误差模型的综合版,不仅之前做了空间自相关,而且在误差项也引入了邻居误差的影响。AICc=378.1l 还
6、有一种做法,先用空间滤波(Spatial Filtering)的方式,移除空间自相关,然后再用简单线性模型去做。2 简述空间聚类方法的种类与基本原理。(1) 层次聚类:通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点。该方法的优点是可随时停止划分,主要步骤如下:(百度)(1)移除网络中的所有边,得到有n个孤立节点的初始状态;(2)计算网络中每对节点的相似度;(3)根据相似度从强到弱连接相应节点对,形成树状图;(4)根据实际需求横切树状图,获得社区结构。(2) 划分聚类:给定一个大小为N的数据集,将其分为m类,使类内具有较高的相似度,而类间的相似度较低。 (3)
7、 密度聚类:基于密度的聚类方法是寻找这样的簇,该簇是基于密度可达性性的最大密度相连对象的集合。不被任何簇所包含的对象被认为是噪声。3 简述空间关系的类型并举例说明。(1)空间方位与距离关系:地理所与北京站。(2)空间拓扑关系:点与点的邻接关系、点与面的包含关系、线与面的相离关系、面与面的重合关系。(3)空间相关:浙江省各市县经济发展空间格局。(4)空间配置关系:南水北调、电网。(5)空间互作用关系:万有引力。(6)空间传播关系:微信朋友圈、疾病。(7)空间网络关系:互联网。(8)空间复杂关系:围棋布局、京津冀城市群。三、 论述题1 如何进行相关分析和空间自相关分析,说明其主要的方法和思路,并结
8、合自己的专业谈谈应用。相关分析:(1)用于测试随机变量之间的统计依赖性(马)。(2) 相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。(百度)。相关分析的主要内容:(百度)(1) 确定现象之间是否存在相关关系,以及相关关系的表现形式。(2) 确定相关关系的密切程度。(3) 确定相关关系的数学表达式,即回归方程。(4) 检验估计值的误差。PS:ppt上的空间自相关l Join-count statistics:空假设:没有空间自相关二值化(BW),Nominal的映射为k-coloured factors
9、计算(BBBWWW)对应的E()、方差、Z-score如果Z-score大于1.96,则拒绝空假设,是clustering还是dispersion看期望值与随机情况下的对比关系;小于1.96,则random;l Lacunarity analysis:用来判别与空间纹理相关的空间对象的散布(扩散)模式分为五种模式。变化gliding box大小,计算Lacunarity统计量通过Lacunarity-r图的五条线趋势判断空间自相关关系主要的方法及思路:(1) Pearson correlation(参数方法,变量之间的线性相关性,整个样本的平均响应):(马)皮尔森相关系数等于两个变量的协方差除
10、于两个变量的标准差。样本的简单相关系数一般用r表示,其中n 为样本量, 分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式)(百度)(2) Spearmans rank correlation (rho)。是一种测试统计依赖性的非参数方法,适用于连续与离散型变量,刻
11、画的是随机变量之间的单调(monotonic)关系,样本对应排序的响应(马)斯皮尔曼等级相关系数,经常用希腊字母表示。 它是衡量两个变量的依赖性的 非参数 指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或1。(百度)(3) Kendall rank correlation(tau)(马)肯德尔检验是一个无参数,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当为1时,表示两个随机变量拥有一致的等级相关性;当为-1时,表示两个随机变量拥有完全相反的等级相关性;当为0时
12、,表示两个随机变量是相互独立的。(百度)(4) 典型相关分析(Canonical correlation analysis): 用于两组变量之间的相关性分析。利用主分量分析的思想,将多个变量和多个变量之间的相关性转化为两个新的综合变量之间的相关,并使得新的综合变量之间存在最大可能的相关。(5) Distance correlation(6) Mutual information: 通过Y对于X不确定程度的减少量。空间自相关分析:空间自相关分析的目的是确定某一变量是否在空间上相关,其相关程度如何。空间自相关分析一般涉及3个步骤(Cliff和Ord,1981;Good-child,1986):取样
13、,计算空间自相关系数或建立自相关函数,自相关显著性检验。空间自相关系数有数种,分别适合于不同数据类型。空间自相关分析在地理统计学科中应用较多,现已有多种指数可以使用,但最主要的有两种指数,即Moran的I系数和Geary的c系数(百度)Moran的I系数:(裴韬 地信B)n为观测值数目;yi 和yj 为某属性特征x在i 和j 上的观测值; wi j为空间权重矩阵, 表示区域i与j的邻近关系当Morans I大于 0 时,表明存在正的空间自相关。当Morans I小于 0 时,表明存在负的空间自相关。当Morans I接近 0 时,表明不存在空间自相关,即观测值在空间上随机排列 。Geary的c
14、系数(裴韬 地信B)其中,n为空间单元的数目,wij为邻接矩阵中的元素,y是y的平均值。Gearys C 总是正值,取值范围一般为 0 到 2 之间,且服从渐近正态分布。当Gearys C小于 1 时,表明存在正的空间自相关。当Gearys C大于 1 时,表明存在负的空间自相关。当Gearys C 值为 1 时,表明不存在空间自相关,即观测值在空间上随机排列 。 应用:(文献)在 1979 年 ,G lick _2 就将空间自相关分析引入到美国宾夕法尼亚州肿瘤地理分 布变异的研究中。Sokal和Thomson分别以Morans I指数、局部GetisOrdG系数和G earys C系数对南美
15、洲某部落43个村庄村民们的基因多态性进行了局部空间自相关分 析,研究结果表明,一个村庄相对于其相邻村庄的位置会影响局部空间自相关分析的结果和遗传基因的多态性.Demirel和 Erdogan利用空间 自相关分析技术 中的全局和局部空间 自相关 ,对 1988- 2006年土耳其的皮肤利什曼病在各省区分布情况进行分析 ,以期了解疾病 的发展趋势 、聚集状况以及病情特殊的省份 。 结果显示 ,皮肤利什曼病在各个省份之间不是随机分布的,具有显著的空间聚集性 ,高发地区集 中在东南地区 ,并且发病有 明显朝东南地区发展的趋势 。 曹志冬、王劲峰等在探寻广州 SARS 流行的空间风险因子与空间相关性特征
16、时采用 采用 MoransI 和 LISA 统计指数定量分析了广州 SARS 发病率的全局和局部的空间相关性特征及其时间变化规律, 发现SARS 发病率的空间聚集性经历了由弱到强再到弱的变化过程, 发病率的高值聚集区域主要位于人口密度高、 经济活跃、 交通发达的城市中心地带, 且在整个 SARS 流行过程中一直没有发生重心转移,2 克里格插值方法主要有哪些类型,分别适用于哪些不同的情况?请结合自己的专业谈谈它们的应用。简单克立格:普通克立格:泛克立格:应用情况:区域化变量Z(x)是非平稳的,即EZ(x)=m(x)泛克立格方法可解决的问题:(1)求区域化变量的漂移m(x)(2)求x处的Z(x)值
17、(3)求区域化变量的漂移系数协同克立格:协同克立格是综合多个变量信息的估值方法协同克立格可以提高估值的准确性,并降低估计方差克里金插值法的应用:曹志冬、王劲峰等在探寻广州 SARS 流行的空间风险因子与空间相关性特征时,以2003年广州市1277例SARS感染者的时空数据为研究对象,利用kriging空间插值技术与核心密度估计技术建立了1km1km精细格网单元上的发病率图,并对人口密度、道路交通、医院、商场、学校等9个空间风险因子进行了深入研究,结果表明这些风险因子均与SARS发病率有显著正相关,严格控制这些风险因子可以有效防控SARS流行。孙海泉在中国大陆地区2008-2012年丙肝流行规律及空间聚集性分析时应用空间自相关的分析方法和Kriging插值分析探测全国丙肝发病区县级的空间聚集区域及变化趋势。周水森、黄芳在研究我国黄淮流域疟疾空间分布特征时利用Kriging法对已建立的疟疾地理信息系统数据库进行空间插值分析,根据无偏最优的原则绘制疟疾发病概率的空间分布图,建立半变异函数,并对预测值的标准误差的分布制图。得出该地区的疟疾在空间分布上与距离有关,并呈现以安徽省中北部与河南交界及河南省与湖北省交界的两个明显的聚集中心,而且其空间分布并非与行政区划分类完全一致。专心-专注-专业