《计量地理学第五章精选文档.ppt》由会员分享,可在线阅读,更多相关《计量地理学第五章精选文档.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量地理学第五章本讲稿第一页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析1地理要素间的相关分析地理要素间的相关分析一、地理相关的意义一、地理相关的意义所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析仅限于测定两个或两个以上的变量间相关程度和性质。而地理相关则是仅限于测定两个或两个以上的变量间相关程度和性质。而地理相关则是指应用相关分析法来研究各地理要素间的相互关系和联系强度。指应用相关分析法来研究各地理要素间的相互关系和联系强度。在地理系统中,各要素间存在着各种不同的关
2、系。一种是确定性的关系,在地理系统中,各要素间存在着各种不同的关系。一种是确定性的关系,即函数关系,这在地理系统中比较少见,因为很多地理要素的变化具有即函数关系,这在地理系统中比较少见,因为很多地理要素的变化具有随机性的缘故;另一种关系是相关关系,即要素间既存在较密切的关系,随机性的缘故;另一种关系是相关关系,即要素间既存在较密切的关系,但又不能由一个要素的值精确地求出另一个要素的值。还有一种情况,但又不能由一个要素的值精确地求出另一个要素的值。还有一种情况,是各要素之间完全没有任何关系。如图是各要素之间完全没有任何关系。如图51所示:所示:本讲稿第二页,共四十三页第五章第五章 地理系统要素间
3、的相关分析与回归分析地理系统要素间的相关分析与回归分析从图中可以看出,若设从图中可以看出,若设x、y为两种地理要素。第一种情况,若为两种地理要素。第一种情况,若y严格随严格随x变化而变化,如变化而变化,如(a)所示,所有观测点均落在直线或曲线上,则称为完全所示,所有观测点均落在直线或曲线上,则称为完全相关或函数关系;第二种情况,若观测点落在直线或曲线两旁,如相关或函数关系;第二种情况,若观测点落在直线或曲线两旁,如(b)所所示,则称为统计相关;第三种情况,若观测点分布散乱,则两种地理要示,则称为统计相关;第三种情况,若观测点分布散乱,则两种地理要素完全无关,相互独立。素完全无关,相互独立。本讲
4、稿第三页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析二、地理相关程度的度量方法二、地理相关程度的度量方法计量地理学中用不同的指标来度量不同类型的地理相关的程度。计量地理学中用不同的指标来度量不同类型的地理相关的程度。(一)简单直线相关程度的度量(一)简单直线相关程度的度量一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和相一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和相关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关与负相关。前者指两个要
5、素间呈同方向变化,而后者相反。这两者可用一与负相关。前者指两个要素间呈同方向变化,而后者相反。这两者可用一个共同的指标度量,就是相关系数。个共同的指标度量,就是相关系数。1.一般常用的相关系数一般常用的相关系数(r)计算公式计算公式其中,其中,本讲稿第四页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析上式计算出的相关系数,具有下列三点性质:上式计算出的相关系数,具有下列三点性质:(1)相关系数的分布范围,介于)相关系数的分布范围,介于1与与+1之间;之间;(2)当相关系数为正值时,表示两个要素之间为正相关,相关系数为负)当相关系数为正值时,表示两
6、个要素之间为正相关,相关系数为负值时,表示两个要素之间为负相关;值时,表示两个要素之间为负相关;(3)相关系数的绝对值越大,表示两个要素间相关程度越密切。)相关系数的绝对值越大,表示两个要素间相关程度越密切。例例1:北京市多年各月平均气温与:北京市多年各月平均气温与5cm深的平均地温,数据如表深的平均地温,数据如表51所示。所示。依据相关系数的计算公式可得:依据相关系数的计算公式可得:0.9995,由此可见,北京市的各月平均气,由此可见,北京市的各月平均气温与温与5cm的平均地温呈正相关,而且相关极为密切。的平均地温呈正相关,而且相关极为密切。本讲稿第五页,共四十三页第五章第五章 地理系统要素
7、间的相关分析与回归分析地理系统要素间的相关分析与回归分析2.顺序(等级)相关系数(顺序(等级)相关系数(rs)计算公式)计算公式顺序相关不但适用于数量资料的相关分析,而且适用于质的资料。表示顺序相关不但适用于数量资料的相关分析,而且适用于质的资料。表示两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算公式来求得。公式来求得。例例2:现仍以北京市各月平均气温与:现仍以北京市各月平均气温与5cm平均地温
8、为例,列成表平均地温为例,列成表52说说明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最大值排为大值排为1号,依次类推。将两个要素的顺序号相减,即为号,依次类推。将两个要素的顺序号相减,即为d,将其平方,将其平方求和并带入上面公式,即可得到两者的顺序相关系数求和并带入上面公式,即可得到两者的顺序相关系数rs。本讲稿第六页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析本讲稿第七页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(
9、二)简单非线性相关程度的度量(二)简单非线性相关程度的度量表示简单非线性相关程度的统计量,通常用相关指数表示简单非线性相关程度的统计量,通常用相关指数Ryx来度量。相关指来度量。相关指数的性质如下:数的性质如下:(1)相关指数的分布范围介于)相关指数的分布范围介于0到到1之间;之间;(2)相关指数的数值越大,两个要素间的曲线相关程度越密切。)相关指数的数值越大,两个要素间的曲线相关程度越密切。(3)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对值。值。本讲稿第八页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析
10、地理系统要素间的相关分析与回归分析(三)多要素相关与相关矩阵(三)多要素相关与相关矩阵对于多个地理要素,则可计算出各要素两两之间的相关系数,并构成相关对于多个地理要素,则可计算出各要素两两之间的相关系数,并构成相关矩阵。矩阵。例例3:现给出世界上自然植被的生产量与水热资源的原始地理数据(表:现给出世界上自然植被的生产量与水热资源的原始地理数据(表53),利用相关系数公式得到其相关矩阵,形式如下所示:),利用相关系数公式得到其相关矩阵,形式如下所示:本讲稿第九页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析三、相关系数的显著性检验三、相关系数的显著
11、性检验为了判定我们所计算出来的相关系数是否有意义,通常还要进一步对相为了判定我们所计算出来的相关系数是否有意义,通常还要进一步对相关系数作显著性检验。关系数作显著性检验。为了使用上方面,前人已经制出了相关系数检验表(附录二)。其中为了使用上方面,前人已经制出了相关系数检验表(附录二)。其中n表示所使用资料的个数(自由度表示所使用资料的个数(自由度f为为n-2),),为信度。为信度。对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,就可以对其进行进一步的回归分析了。就可以对其进行进一步的回归分析了。本讲稿第十页,共四十
12、三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2地理要素间的回归分析地理要素间的回归分析一、地理回归分析的意义和作用一、地理回归分析的意义和作用地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的统计规律,而用回归方程来表达。统计规律,而用回归方程来表达。地理回归分析主要是研究地理要素之间联系的数学表达式,有自变量与地理回归分析主要是研究地理要素之间联系的数学表
13、达式,有自变量与因变量之分,从而可由自变量的取值来预测、延长或插补和控制因变量因变量之分,从而可由自变量的取值来预测、延长或插补和控制因变量的取值,所以它有地理预测的性质。的取值,所以它有地理预测的性质。地理回归分析的主要内容包括:地理回归分析的主要内容包括:1.1.由一组地理数据确定这些要素间的定量数学表达式,即回归模型;由一组地理数据确定这些要素间的定量数学表达式,即回归模型;2.2.利用回归模型,根据自变量的值来预测或控制因变量的取值。利用回归模型,根据自变量的值来预测或控制因变量的取值。本讲稿第十一页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与
14、回归分析二、一元地理回归模型的建立二、一元地理回归模型的建立一元地理回归是要解决两个要素间的定量关系。由于两个要素之间的数一元地理回归是要解决两个要素间的定量关系。由于两个要素之间的数量关系类型的差别,一元地理回归包括线性回归模型和非线性回归模型量关系类型的差别,一元地理回归包括线性回归模型和非线性回归模型分述如下:分述如下:(一)一元线性地理回归模型的建立(一)一元线性地理回归模型的建立假设有两个要素(变量)假设有两个要素(变量)x x和和y y。x x为自变量,为自变量,y y为因变量。为因变量。x x可以是降水量、可以是降水量、蒸发量、土壤中的有机质含量等;蒸发量、土壤中的有机质含量等;
15、y y可以是河流径流量、土壤含水量等。可以是河流径流量、土壤含水量等。假定一元线性模型结构为:假定一元线性模型结构为:y yi i=A+Bx=A+Bxi i+i i式中,式中,A A、B B为待定参数,为待定参数,i=1,2,.,ni=1,2,.,n,而(,而(x xi i,y yi i)为)为n n组观测数据,组观测数据,i i为随机变量。参数为随机变量。参数A A、B B一般总是未知的,需根据观测值采用最小二乘一般总是未知的,需根据观测值采用最小二乘法来估计。法来估计。本讲稿第十二页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析设设a a和和
16、b b分别为参数分别为参数A A和和B B的最小二乘估计值,于是便得到了一元线性回归模的最小二乘估计值,于是便得到了一元线性回归模型为型为上式代表上式代表x x和和y y之间关系的最佳拟和直线,通常称为回归直线。它满足之间关系的最佳拟和直线,通常称为回归直线。它满足y y的的实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。1.1.参数参数a a和和b b的最小二乘估计的最小二乘估计根据最小二乘原理,可得根据最小二乘原理,可得a a、b b的计算公式如下:的计算公式如下:本讲稿第十三页,共四十三页第五章第五章 地理系统要素间的相
17、关分析与回归分析地理系统要素间的相关分析与回归分析2.2.一元线性地理回归模型的具体建立方法与步骤一元线性地理回归模型的具体建立方法与步骤建立一元线性地理回归模型,就是用已有的地理数据来确定建立一元线性地理回归模型,就是用已有的地理数据来确定a a和和b b的值。现的值。现仍以北京市各月平均气温仍以北京市各月平均气温x x与与5cm5cm平均地温平均地温y y为例,建立一元线性地理回归为例,建立一元线性地理回归模型的过程如下:模型的过程如下:(1 1)将表中的各项数据代入相应的计算公式,得到)将表中的各项数据代入相应的计算公式,得到a a、b b的数值。的数值。(2 2)当参数)当参数a a与
18、与b b求出后,便可得出一元线性地理回归模型如下:求出后,便可得出一元线性地理回归模型如下:本讲稿第十四页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析3.3.一元线性地理回归模型的效果检验一元线性地理回归模型的效果检验当一元线性地理回归模型求出来以后,它的效果如何,它所揭示的地理规当一元线性地理回归模型求出来以后,它的效果如何,它所揭示的地理规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一步律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一步作出分析。作出分析。(1 1)回归模型估计的误差)回归模型估计的误差由线性回
19、归模型所得到的由线性回归模型所得到的y y的估计值往往与实测值的估计值往往与实测值y y不完全一致,它们之间不完全一致,它们之间的误差称为估计误差,以标准差的形式表示为的误差称为估计误差,以标准差的形式表示为在实际地理问题中,只要比较在实际地理问题中,只要比较S S与允许的偏差即可。与允许的偏差即可。本讲稿第十五页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(2 2)回归模型的显著性检验)回归模型的显著性检验观测值观测值y yi i与其平均值与其平均值yy的差异可用离差平方和来表示,记为的差异可用离差平方和来表示,记为S S总总。它又可以。它又
20、可以进行如下的分解:进行如下的分解:上式右侧的第一项是所有观测点上式右侧的第一项是所有观测点yiyi与回归值的残差平方和,表示除了与回归值的残差平方和,表示除了x x对对y y的线性影响以外的一切因素对的线性影响以外的一切因素对y y的变异影响,故称为剩余平方和,记作的变异影响,故称为剩余平方和,记作Q Q;第二项反映了在第二项反映了在y y的总偏差中,由的总偏差中,由x x与与y y的线性关系引起的的线性关系引起的y y的变化分布,故的变化分布,故称为回归平方和,记作称为回归平方和,记作U U。故有:。故有:S S总总U+QU+Q。本讲稿第十六页,共四十三页第五章第五章 地理系统要素间的相关
21、分析与回归分析地理系统要素间的相关分析与回归分析一个回归效果的好坏取决于一个回归效果的好坏取决于U U在总离差平方和中的比例或者在总离差平方和中的比例或者U U与与Q Q的比值。的比值。若取前者则有:若取前者则有:从从U U与与Q Q比值的大小来考虑,可利用如下的比值的大小来考虑,可利用如下的F F检验方法。检验方法。根据前人的研究,统计量根据前人的研究,统计量F FU/(Q/(n-2)U/(Q/(n-2)符合第一自由度为符合第一自由度为1 1,第二自由,第二自由度为度为n-2n-2的的F F分布,根据前面学习的分布,根据前面学习的F F检验方法,即可对回归模型的显著检验方法,即可对回归模型的
22、显著性进行检验。性进行检验。本讲稿第十七页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(二)一元非线性地理回归模型的建立(二)一元非线性地理回归模型的建立在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而是在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而是某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理实际某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理实际情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉米产量情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉米产量与耗水量之间
23、的关系等等。与耗水量之间的关系等等。对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化曲对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化曲线回归模型为直线回归模型处理。线回归模型为直线回归模型处理。本讲稿第十八页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析1.1.选配曲线的基本方法选配曲线的基本方法根据理论分析、过去的经验或观测数据的分根据理论分析、过去的经验或观测数据的分布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而求非布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而求非线性地理回归模型的过
24、程及其方法,叫做曲线选配。线性地理回归模型的过程及其方法,叫做曲线选配。一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性回一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性回归的方法确定参数。当曲线的函数类型确定后,下一步就是求函数中的参归的方法确定参数。当曲线的函数类型确定后,下一步就是求函数中的参数数a a和和b b。确定参数的办法仍然是最小二乘法。确定参数的办法仍然是最小二乘法。本讲稿第十九页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2.2.地理上常见的非线性回归模型的建立方法地理上常见的非线性回归模型的建立方
25、法在地理问题上,较常见的曲线类型有:幂函数型、指数函数型、对数函数在地理问题上,较常见的曲线类型有:幂函数型、指数函数型、对数函数型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。(1 1)幂函数型)幂函数型两个地理要素之间的幂函数表达式为两个地理要素之间的幂函数表达式为y=axy=axb b对上式两边取常用对数或自然对数,得对上式两边取常用对数或自然对数,得lny=lna+blnxlny=lna+blnx令令Y=lnyY=lny,A=lnaA=lna,X=lnxX=lnx,则上式为,则上式为 Y=A+bX Y=A+bX这样
26、就将曲线模型转化成线性模型了。这样就将曲线模型转化成线性模型了。本讲稿第二十页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析例如:长白山北麓熔岩台地地貌形态的变化,见表例如:长白山北麓熔岩台地地貌形态的变化,见表5 56 6,即呈幂函数曲线,即呈幂函数曲线型。设型。设x x表示各地点距白头山天池火口壁的距离(表示各地点距白头山天池火口壁的距离(kmkm),),y y为熔岩台地各地为熔岩台地各地点的海拔高度(点的海拔高度(m m)。幂函数回归模型和拟和图如图)。幂函数回归模型和拟和图如图5 54 4所示。所示。本讲稿第二十一页,共四十三页第五章第五
27、章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(2 2)指数函数型)指数函数型两个地理要素之间的指数函数表达式为两个地理要素之间的指数函数表达式为y=aey=aebxbx或或y=aey=ae-bx-bx,y=aby=abx x然后对上式两边取常用对数或自然对数,则得然后对上式两边取常用对数或自然对数,则得lny=lna+(lnb)xlny=lna+(lnb)x令令Y=lnyY=lny,A Alnalna,B=lnbB=lnb则上式为则上式为Y YA ABxBx这样指数函数模型就转化成线性模型了。这样指数函数模型就转化成线性模型了。本讲稿第二十二页,共四十三页第五章第五
28、章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析例如:长白山北麓地形高度对年降水量的影响,即按指数规律递增,见表例如:长白山北麓地形高度对年降水量的影响,即按指数规律递增,见表5 57 7和图和图5 55 5所示。由图中模型可知,长白山北坡的年降水量是按指数规所示。由图中模型可知,长白山北坡的年降水量是按指数规律增加的,其相关指数达律增加的,其相关指数达0.99920.9992。本讲稿第二十三页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(3 3)对数函数型)对数函数型两个地理要素之间的对数函数关系表达式为两个地理要素之
29、间的对数函数关系表达式为y=a+blnxy=a+blnx令令X Xlnxlnx,上式可直接转化为直线方程如下:,上式可直接转化为直线方程如下:Y=a+bXY=a+bX例如:当土壤湿度为最大田间持水量的例如:当土壤湿度为最大田间持水量的50506060,雨强为,雨强为1.01.02.0 2.0 mm/minmm/min时,淋溶和退化黑钙土区的地形坡度对径流系数的影响,即符合对时,淋溶和退化黑钙土区的地形坡度对径流系数的影响,即符合对数规律。见表数规律。见表5 58 8和图和图5 56 6。径流系数随地形坡度的增加按对数律递增,。径流系数随地形坡度的增加按对数律递增,相关指数达相关指数达0.998
30、60.9986。当地形坡度为零度时,该区域径流系数为。当地形坡度为零度时,该区域径流系数为0.450.45;当地;当地形坡度平均每增加形坡度平均每增加1 1度时,该区径流系数平均增加度时,该区径流系数平均增加0.080.08。本讲稿第二十四页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析图表说明如下:图表说明如下:本讲稿第二十五页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析3.3.一元非线性回归模型的效果检验一元非线性回归模型的效果检验在选配曲线的回归过程中,首先遇到的问题就是曲线类型的选择。因为
31、曲在选配曲线的回归过程中,首先遇到的问题就是曲线类型的选择。因为曲线类型选择恰当,不仅对揭示出要素间的内在规律具有重要意义,而且对线类型选择恰当,不仅对揭示出要素间的内在规律具有重要意义,而且对于减少剩余误差、提高回归模型的效果更具有实际意义。否则,其效果往于减少剩余误差、提高回归模型的效果更具有实际意义。否则,其效果往往不能令人满意,甚至会歪曲要素间的内在规律性。往不能令人满意,甚至会歪曲要素间的内在规律性。那么,怎样衡量曲线回归模型的好坏呢?在衡量一元线性回归模型的效果那么,怎样衡量曲线回归模型的好坏呢?在衡量一元线性回归模型的效果时,我们采用了相关系数的平方等于回归平方和与总平方和之比,
32、即时,我们采用了相关系数的平方等于回归平方和与总平方和之比,即 或用剩余平方和来表示,则为或用剩余平方和来表示,则为在选配曲线的过程中,要求所配曲线与地理数据拟和较好,可利用上面右在选配曲线的过程中,要求所配曲线与地理数据拟和较好,可利用上面右式定义的量来衡量所配曲线效果的好坏,记作式定义的量来衡量所配曲线效果的好坏,记作R R2 2,称为相关指数。,称为相关指数。本讲稿第二十六页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析相关指数越大,表明选配的回归曲线效果越好,剩余标准差越小,其回归相关指数越大,表明选配的回归曲线效果越好,剩余标准差越小,
33、其回归模型的预测精度就越高。现以表模型的预测精度就越高。现以表5 58 8中数据为例,计算出剩余平方和与总中数据为例,计算出剩余平方和与总平方和如表平方和如表5 59 9所示。其相关指数为所示。其相关指数为R R2 2=1-0.0001/0.0298=1-0.0034=0.997=1-0.0001/0.0298=1-0.0034=0.997剩余标准差为剩余标准差为由此可见,地形坡度对径流系数影响的模型拟和效果很好,而且剩余标准由此可见,地形坡度对径流系数影响的模型拟和效果很好,而且剩余标准差也很小,因此模型的预测精度也很高。差也很小,因此模型的预测精度也很高。本讲稿第二十七页,共四十三页第五章
34、第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析三、多元地理回归模型的建立三、多元地理回归模型的建立一个地理系统的基本特点之一,是它具有多要素性,而且各要素之间相一个地理系统的基本特点之一,是它具有多要素性,而且各要素之间相互联系、相互影响。当研究某一个要素互联系、相互影响。当研究某一个要素y y与其他要素与其他要素x x1 1,x,x2 2,x,x3 3,.,x,.,xn n之间之间的定量关系时,就需要用多元回归分析方法。这里同样也有线性和非线的定量关系时,就需要用多元回归分析方法。这里同样也有线性和非线性之分。下面分别介绍线性与非线性多元回归模型的建立方法。性之
35、分。下面分别介绍线性与非线性多元回归模型的建立方法。(一)多要素线性地理回归模型的建立(一)多要素线性地理回归模型的建立1.1.多要素线性地理回归模型的建立方法多要素线性地理回归模型的建立方法一般设其数学结构模型为一般设其数学结构模型为y y=0 0+1 1x x 1 1+2 2x x 2 2+3 3x x 3 3+.+.+k kx x k k+采用最小二乘法,得到回归模型为采用最小二乘法,得到回归模型为y=by=b0 0+b+b1 1x x1 1+b+b2 2x x2 2+.+b+.+bk kx xk k(b bk k为偏回归系数)为偏回归系数)本讲稿第二十八页,共四十三页第五章第五章 地理
36、系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析偏回归系数的意义表明:当其他要素都固定时,该自变量每变化一个单偏回归系数的意义表明:当其他要素都固定时,该自变量每变化一个单位而使位而使y y平均改变的数值。偏回归系数的确定同样是依据最小二乘法原理,平均改变的数值。偏回归系数的确定同样是依据最小二乘法原理,即使即使达到最小,式中达到最小,式中为观测数据的序号,将上式对为观测数据的序号,将上式对b b0 0,b,b1 1,.,b,.,bk k求偏倒数,求偏倒数,并令其都等于零,即并令其都等于零,即本讲稿第二十九页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要
37、素间的相关分析与回归分析经展开整理后得经展开整理后得本讲稿第三十页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析以上方程组称为正规方程组,由其系数构成得矩阵记作以上方程组称为正规方程组,由其系数构成得矩阵记作A AX XX,即,即上述方程组可写成上述方程组可写成Ab=B的形式,其中的形式,其中B=XY。解这个方程组即可得到各。解这个方程组即可得到各个变量的偏回归系数。个变量的偏回归系数。将求出的偏回归系数和常数项代入多元线性数学模型中,即可得到将求出的偏回归系数和常数项代入多元线性数学模型中,即可得到k元线元线性地理回归模型。性地理回归模型。本讲
38、稿第三十一页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析例如:某一国家某一经济区内木材生产指数例如:某一国家某一经济区内木材生产指数y y(以(以19551955年为年为100100)受该区森)受该区森林蓄积量指数林蓄积量指数x x1 1,木材价格指数,木材价格指数x x2 2和运输距离指数和运输距离指数x x3 3的影响,如表的影响,如表5 51010所所示。示。可利用可利用DoolittleDoolittle法或利用法或利用ExcelExcel等软件工具计算出其多元线性回归模型的等软件工具计算出其多元线性回归模型的偏回归系数及常数项。偏回归
39、系数及常数项。本讲稿第三十二页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2.2.多元线性回归模型的显著性检验多元线性回归模型的显著性检验在多元线性回归问题中,同一元线性回归一样也需要对回归模型进行显著在多元线性回归问题中,同一元线性回归一样也需要对回归模型进行显著性检验。如果经过检验是显著的,则说明建立的回归模型是有用的,否则性检验。如果经过检验是显著的,则说明建立的回归模型是有用的,否则就没有什么实际意义。就没有什么实际意义。在多元线性回归分析中,同样也存在回归平方和在多元线性回归分析中,同样也存在回归平方和U U与剩余平方和与剩余平方和Q
40、 Q,两者的,两者的自由度分别自由度分别k k和和n-k-1n-k-1,于是剩余标准差为,于是剩余标准差为S Ssqrt(Q/(n-k-1)sqrt(Q/(n-k-1)。同样可对整个回归模型进行显著性检验,通常采用同样可对整个回归模型进行显著性检验,通常采用F F检验法。检验法。F F值为回归值为回归方差和剩余方差之比,即方差和剩余方差之比,即根据检验的结果,在根据检验的结果,在F F值的右上角可标注星号。值的右上角可标注星号。例如:前面例子中的检验结果就表明多元线性关系具有高度显著性。例如:前面例子中的检验结果就表明多元线性关系具有高度显著性。本讲稿第三十三页,共四十三页第五章第五章 地理系
41、统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(二)多要素非线性地理回归模型的建立(二)多要素非线性地理回归模型的建立在地理系统中,除部分问题是属线性关系外,还有大部分问题属于非线性在地理系统中,除部分问题是属线性关系外,还有大部分问题属于非线性关系。下面扼要地介绍两种多元非线性地理回归模型的建立方法。关系。下面扼要地介绍两种多元非线性地理回归模型的建立方法。1.1.多项式回归模型的建立方法多项式回归模型的建立方法在地理系统中,有些曲线不能化为直线处理,如二次多项式就不能化为线在地理系统中,有些曲线不能化为直线处理,如二次多项式就不能化为线性模型。一般的处理方法是将它化为二元线
42、性回归模型,然后按照多元线性模型。一般的处理方法是将它化为二元线性回归模型,然后按照多元线性回归分析方法处理。这种方法可以处理大部分一元非线性回归模型,因性回归分析方法处理。这种方法可以处理大部分一元非线性回归模型,因为任何函数形式都可以在较小区间内用多项式逐步逼近。为任何函数形式都可以在较小区间内用多项式逐步逼近。当多项式回归的自变量取两次幂时,便是二次多项式,即抛物线。其数学当多项式回归的自变量取两次幂时,便是二次多项式,即抛物线。其数学模型为模型为y=by=b0 0+b+b1 1x+bx+b2 2x x2 2,令,令x1=x,x2=xx1=x,x2=x2 2,则模型变为,则模型变为y=b
43、y=b0 0+b+b1 1x x1 1+b+b2 2x x2 2。可用二。可用二元线性回归的方法确定模型参数。元线性回归的方法确定模型参数。本讲稿第三十四页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析例如,依据黑龙江省的实测资料(表例如,依据黑龙江省的实测资料(表5 51414),土温与地积温系数),土温与地积温系数k k之间的之间的关系,便可用多项式回归化成线性回归来处理。关系,便可用多项式回归化成线性回归来处理。将表将表5 51414中的数据点绘成散点图中的数据点绘成散点图5 57 7可知,这个问题可用抛物线来近似。可知,这个问题可用抛物线
44、来近似。用用ExcelExcel等软件及手动计算均可得到具体的二次多项式模型。等软件及手动计算均可得到具体的二次多项式模型。本讲稿第三十五页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析若多项式回归的自变量为三次幂时,则为三次多项式,其数学表达式为若多项式回归的自变量为三次幂时,则为三次多项式,其数学表达式为y=by=b0 0+b+b1 1x+bx+b2 2x x2 2+b+b3 3x x3 3例如,日本例如,日本1931193119571957年粮食生产指数,即可用三次多项式回归来拟合。年粮食生产指数,即可用三次多项式回归来拟合。日本粮食生产指
45、数模型和拟合情况,见图日本粮食生产指数模型和拟合情况,见图5 59 9所示。所示。本讲稿第三十六页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2.2.幂函数乘积模型的建立方法幂函数乘积模型的建立方法这是一种用途广泛,计算方便,物理意义清楚,要素间关系明确的数学模这是一种用途广泛,计算方便,物理意义清楚,要素间关系明确的数学模型。这种方法的基本思路是把某一要素型。这种方法的基本思路是把某一要素y y与其他要素与其他要素xixi之间的函数关系写之间的函数关系写成幂函数的连乘积形式,即成幂函数的连乘积形式,即y=k*xy=k*x1 1a a*x*x2
46、 2b b*x*x3 3c c*x*x4 4d d.式中,式中,k k、a a、b b、c c、d d为待定地理参数。建立幂函数乘积模型的模型,也为待定地理参数。建立幂函数乘积模型的模型,也就是确定参数的过程。教材讲了一种办法,也可直接将幂函数乘积模型变就是确定参数的过程。教材讲了一种办法,也可直接将幂函数乘积模型变换为多元线性回归模型显然更为简便。换为多元线性回归模型显然更为简便。可对模型两侧同时取自然对数,对变换后的多元线性回归模型利用前面讲可对模型两侧同时取自然对数,对变换后的多元线性回归模型利用前面讲过的方法,确定各个参数,然后再根据变换关系将其重新转换为幂函数乘过的方法,确定各个参数
47、,然后再根据变换关系将其重新转换为幂函数乘积模型。积模型。本讲稿第三十七页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析例如:前苏联例如:前苏联1965196519741974年钢产量(年钢产量(y y)与焦炭产量()与焦炭产量(r1r1)、生铁产量)、生铁产量(r2r2)和发电量()和发电量(r3r3)之间的关系,便可用幂函数乘积模型来表达。原始)之间的关系,便可用幂函数乘积模型来表达。原始数据如表数据如表5 51616所示。所示。按照书上的计算办法,可得到前苏联钢产量与焦炭产量、生铁产量和发电按照书上的计算办法,可得到前苏联钢产量与焦炭产量、
48、生铁产量和发电量之间关系可用下式来表达:量之间关系可用下式来表达:y=1.637xy=1.637x1 10.00370.0037x x2 20.97790.9779x x3 30.00180.0018其拟合效果良好,影响钢产量最大因素是生铁产量,其次为焦炭产量。其拟合效果良好,影响钢产量最大因素是生铁产量,其次为焦炭产量。本讲稿第三十八页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析3地理系统的空间趋势面分析地理系统的空间趋势面分析一、空间趋势面分析概述一、空间趋势面分析概述地理系统的最重要特征之一是它具有区域性。用数学的方法,以数学模地理系统的
49、最重要特征之一是它具有区域性。用数学的方法,以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法,称为趋势面型来模拟地理数据的空间分布及其区域性变化趋势的方法,称为趋势面分析。趋势面是一种光滑的数学曲面,它能集中代表地理数据在大范围分析。趋势面是一种光滑的数学曲面,它能集中代表地理数据在大范围内的空间变化趋势。内的空间变化趋势。趋势面只是实际曲面的一种近似。它反映了区域性的变化规律,受大范趋势面只是实际曲面的一种近似。它反映了区域性的变化规律,受大范围的系统性因素所控制;剩余曲面则反映了局部性变化特点,受局部因围的系统性因素所控制;剩余曲面则反映了局部性变化特点,受局部因素和随机因素所制
50、约。素和随机因素所制约。前者对应于一个确定性函数,而后者则对应于一个随机性函数。一般常前者对应于一个确定性函数,而后者则对应于一个随机性函数。一般常采用多项式函数来计算趋势面。采用多项式函数来计算趋势面。本讲稿第三十九页,共四十三页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析二、趋势面分析的数学模型二、趋势面分析的数学模型(一)趋势面分析的数学原理(一)趋势面分析的数学原理设以设以zi(xi,yi)表示某一地理特征值在空间上的分布(图表示某一地理特征值在空间上的分布(图511)。其中)。其中(xi,yi)为平面上点的坐标。由上述已知,任一观测点可分解为两个