《地统计学复习知识点中学教育中考中学教育中考.pdf》由会员分享,可在线阅读,更多相关《地统计学复习知识点中学教育中考中学教育中考.pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1.地统计学概念:地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。2.经典统计学与地统计学的区别:经典统计学:研究纯随机变量、变量可无限次重复观测或大量重复观测、样本相互独立、研究样本的数字特征地统计学:研究区域化变量、变量不能重复试验、样本具有空间相关性、研究样本的数字特征和区域化变量的空间分布特征 3.地统计学的起源和发展-:4.总体:指根据统计分析或研究目的而确定的同类事物或现象的全体。有时也把具有共同性质的元素所组成的集合称为总体。5.样本:从总体中抽取若干元素而构成的集合称为样本,也称子样。6.频数:将
2、变量按大小顺序排序,并按一定间距分组,称变量在各组出现的次数,称为频数。7.随机变量的数字特征:集中性度量:算数平均值中数众数数学期望;离散型度量极差离差方差协方差矩变异系数;形态度量(偏度(对称程度)和峰度(高低程度)是描述随机变量频率分布形态的两个定量指标)8.相关关系:指事物之间的关系数值存在着一定的依存关系,即某一现象在其发展变化中,当数量上为一确定值时,与之有联系的其他现象可以有若干个数值与之对应,但这些值按某种规律在一定范围内进行波动。9.相关关系的特点:一个变量的取值不能由另一个变量唯一确定,也不能用函数形式给予描述,但并不是无规律可行的。10.相关关系的种类:按所涉及的变量的多
3、少:单相关:两个变量之间的相关。复相关:三个或三个以上变量之间的相关。按相关关系的表现形态:直线相关:如果两个变量之间相互变化近似为一条直线,则称为直线相关。曲线相关:变量之间的相互变化近似为一条曲线。简单相关关系下按变量变动的方向:正相关:两个变量同方向变化。负相关:两个变量反方向变化。无相关(或零相关):两个量的变化互不影响。11.相关关系的判断方法:作图法,假设检验法。12.偏相关:当研究某一个要素对另一个要素的影响或相关程度时,暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关。用来度量偏相关程度的统计量称为偏相关系数。13.偏相关系数性质:系数范围在
4、-1和 1 之间;系数的绝对值越大,其偏相关程度越大;系数的绝对值小于等于由同一系列资料求得的负相关系数。13.复相关系数:几个要素同时与某一个要素之间的相关关系。14.回归分析:回归分析就是对具有高度相关关系的现象,根据其相关的形态,建立一个适宜的数学模型(回归方程),来近似地反映变量之间的一般变化关系,以便于进行估计或预测的统计方法。15.一元线性回归分析步骤:建立一元线性回归方程:y=a+bx。回归系数的估计。对一元回归方程的评价:拟合优度的评价,回归方程显著性检验。16.非线性回归模型:指数曲线 y=debx 可以将其转化为直线形式:y=a+bx,a=lnd 对数曲线 y=a+blnx
5、 可以将其转化为直线形式:y=a+bx幂函数曲线 y=dxb 可以将其转化为直线形式:y=a+bx,其中,a=lnd 双曲线 1/y=a+b/x 可转化为直线形式:y=a+bx对于 S型曲线=1/(+(),可转化为直线形式:y=a+bx 17.地理数据:地理数据是用一定的测度标准去衡量地理要素而取得的地理信息。18.地理数据类型:定量地理数据:间隔尺度数据比例尺度数据定性地理数据:有序数据二元数据名义尺度数据 19.频率分析:两种检验方法:频率分布直方图、正态 QQplot 分布图。20.离群值分析:分为全局离群值(对于数据中的所有点具有很高或很低值的观测样点)和局部离群值(数据中对于其周围的
6、点的值具有很高或很低观测值的样点)。21.离群值分析方法:直方图识别全局离群值变异函数云图识别离群值Voronoi 图识别离群值 22.全局趋势分析:指从总体上分析数据集在空间某一特定方向上的变化趋势。23.空间自相关性分析:空间上距离较近的采集点差异性会较小而相似性较大;距离较远的点差异性较大而相似性较小。24.各向异性分析:25.区域化变量的概念:以空间点 x 的三个直角坐标 xu,xv,xw 为自变量的随机场Z(xu,xv,xw)=Z(x),称为区域化变量。26.区域化变量性质:随机性和结构性空间局限性不同程度的空间连续性不同类型的各向异性 27.协方差函数(会计算)性质:先验方差不能小
7、于零是一个偶函数协方差绝对值小于等于先验方差 C()=0协方差函数矩阵必须是非负定矩阵。28.变异函数性质:24)变异函数性质:h=0 时,变异函数为零是一个偶函数研究对象的变异函数只能大于或等于零()=C(0)构成的变异函数矩阵必须是条件非负定矩阵。29.变异函数的功能:变异函数通过“变程”反映变量的影响范围;“基台值”反映区域化变量在研究范围内变异的强度不同方向上的变异函数图可反映区域化变量的各向异性块金常数 C0的大小可反映区域化变量的随机性大小变异函数在原点处的性状可反映区域化变量不同程度的空间连续性 30.二阶平稳假设(为了统计推断的需要,在线性地统计学研究中,一般只需要假设其一、而
8、、二阶矩阵存在且平稳,即二阶平稳假设)条件:研究区域内 Z(x)的数学期望存在;的协方差函数存在且平稳。31.内蕴假设:基本思想:只考虑区域化变量的增量而不考虑变量本身。当区域化变量 Z(x)的增量 Z(x)-Z(x+h)满足下列两个条件时(区域化变量 Z(x)的增量的数学期望为 0Z(x)的增量的方差函数对于任意 x 和 h 存在,且平稳),则该区域化变量满足内蕴假设。32.变异函数的理论模型:有基台值模型:纯块金效应模型球状模型指数模型高斯模型线性有基台值模型。无基台值模型:线性无基台值模型幂函数模型对数模型孔穴效应模型(可有有基台或无基台模型)33.结构分析:构造一个变异函数模型对于全部
9、有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构。34.套合结构:把分别出现在不同距离 h 上和(或)不同方向 上同时起作用的变异性组合起来。可以表示为多个变异函数之和,每一个变异函数代表一个方向一种特定尺度上的变异性。35.估计方差的概念:36.单一方向的套合(计算):每一个变异函数代表同一方向上一种特定尺度的变异,并可以用不同的变异函数理论模型来拟合,即单一方向的套合结构。37.各向异性的种类:几何异向性(当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性);带状异向性(当区域化变量在不同方向上变异性差异不能用简单几何变换得到时,就称
10、为带状异向性。)。38.变异函数理论模型的最优拟合:概念:根据实验变异函数值,选择合适的理论模型来拟合一条最优的理论变异函数曲线。步骤:确定变异函数模型形态(或确定曲线类型)模型参数的最优估计模型拟合评价。39.结构分析的步骤:区域化变量选择数据的获取与审议数据的统计分析变异函数性或空间相关和依赖性的自然现象的科学经典统计学与地统计学的区别经典统计学研究纯随机变量变量可无限次重复观测或大量重复观测样本相互独立研究样本的数字特征地统计学研究区域化变量变量不能重复试验样本具有空间相确定的同类事物或现象的全体有时也把具有共同性质的元素所组成的集合称为总体样本从总体中抽取若干元素而构成的集合称为样本也
11、称子样频数将变量按大顺序排序并按一定间距分组称变量在各组出现的次数称为频数随机变量的程度和峰度高低程度是描述随机变量频率分布形态的两个定量指标相关关系指事物之间的关系数值存在着一定的依存关系即某一现象在其发展变化中当数量上为一确定值时与之有联系的其他现象可以有若干个数值与之对应但这些值的计算变异函数的结构分析各向异性理论变异函数模型的最优拟合及检验变异函数理论模型的专业分析 40.克里格法概念:又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行线性无偏最优估计的一种方法。41.克里格法种类:简单克立格法普通克立格法泛克立格法对数
12、正态克立格法 指示克立格法概率克立格析取克立格法协同克立格法 42.泛克里格法:在漂移的形式 EZ(x)=m(x),和非平稳随机函数 Z(x)的协方差函数 C(h)或变异函数(h)为已知的条件下,一种考虑到有漂移的无偏线性估计量的地统计学方法,这种方法属于线性非平稳地统计学范畴。43.漂移:非平稳区域化变量 Z(x)的数学期望,在任一点 x 上的漂移就是该点上区域化变量Z(x)的数学期望。44.涨落:是一个数学期望为 0 的区域化变量,可认为涨落是围绕漂移 m(x)摆动的随机误差。45.非线性克里格法:对数正态克里格法指示克里格法析取克里格法 46.协同克里格法:是多元地统计学研究的基本方法,
13、建立在协同区域化变量理论基础之上,利用多个区域化变量之间的互相关性,通过建立交叉协方差函数和交叉变异函数模型,用易于观测和控制的变量对不易观测的变量进行局部估计。47.交叉协方差函数和交叉变异函数性质(计算)性或空间相关和依赖性的自然现象的科学经典统计学与地统计学的区别经典统计学研究纯随机变量变量可无限次重复观测或大量重复观测样本相互独立研究样本的数字特征地统计学研究区域化变量变量不能重复试验样本具有空间相确定的同类事物或现象的全体有时也把具有共同性质的元素所组成的集合称为总体样本从总体中抽取若干元素而构成的集合称为样本也称子样频数将变量按大顺序排序并按一定间距分组称变量在各组出现的次数称为频数随机变量的程度和峰度高低程度是描述随机变量频率分布形态的两个定量指标相关关系指事物之间的关系数值存在着一定的依存关系即某一现象在其发展变化中当数量上为一确定值时与之有联系的其他现象可以有若干个数值与之对应但这些值