《计量地理学第三章统计分析方法相关分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《计量地理学第三章统计分析方法相关分析优秀课件.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量地理学第三章统计分析方法相关分析第1页,本讲稿共48页1地理要素间的相关分析2地理要素间的回归分析3时间序列分析法4系统聚类分析方法5主成分分析方法6马尔可夫预测方法7地理系统的空间趋势面分析第2页,本讲稿共48页1地理要素间的相关分析地理相关的意义地理相关程度的度量方法相关系数的显著性检验多要素间相关程度的测度第3页,本讲稿共48页地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数的计算与检验来完成的第4页,本讲稿共48页一、地理相关的意义相关与地理相关相关与地理相关 相关是指两个或两个以上变数间相互关系是否密
2、切。在研究相关是指两个或两个以上变数间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。相关分析仅限于测定两个或两个以上变数视实际需要确定。相关分析仅限于测定两个或两个以上变数具有相关关系者,其主要目的是计算出表示两个或两个以上具有相关关系者,其主要目的是计算出表示两个或两个以上变数间的相关程度和性质变数间的相关程度和性质 地理相关,就是应用相关分析法来研究各地理要素间的相互地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标关系和联系强度的一种度量指标 第5页,本讲稿共4
3、8页地理要素间的关系函数关系:函数关系:确定性的关系,这种关系在地理各确定性的关系,这种关系在地理各要素间较少见,这是因为许多地理要素的变化要素间较少见,这是因为许多地理要素的变化具有随机性的缘故;具有随机性的缘故;相关关系:相关关系:即要素间既存在密切的关系,但又即要素间既存在密切的关系,但又不能由一个(或几个)要素(或变量)的值明不能由一个(或几个)要素(或变量)的值明确地求出另一个要素(变量)的值确地求出另一个要素(变量)的值 第6页,本讲稿共48页第7页,本讲稿共48页二、地理相关程度的度量方法(一)简单直线相关程度的度量相关程度相关程度研究两个地理要素之间的相互关系是否密切研究两个地
4、理要素之间的相互关系是否密切相关方向相关方向正相关:正相关:y y值随值随x x的增加而变大或随的增加而变大或随x x的减少而变小的减少而变小负相关:负相关:y y值随值随x x的增加而变小或随的增加而变小或随x x的减少而增大的减少而增大第8页,本讲稿共48页1、一般常用相关系数的计算第9页,本讲稿共48页rxy为要素x与y之间的相关系数,它就是表示该两要素之间相关程度的统计指标,其值在-1,1区间之内r rxyxy0 0,表示正相关,即两要素同向发展,表示正相关,即两要素同向发展r rxyxy0 0,表示负相关,即两要素异向发展,表示负相关,即两要素异向发展r rxyxy 的绝对值越接近于
5、的绝对值越接近于1 1,表示两要素的关系,表示两要素的关系越密切;越密切;越接近于越接近于0 0,表示两要素的关系越,表示两要素的关系越不密切不密切第10页,本讲稿共48页第11页,本讲稿共48页第12页,本讲稿共48页 举例,北京市多年各月平均气温与举例,北京市多年各月平均气温与5cm5cm深的平均地温,深的平均地温,如表所示,请计算两者的相关系数如表所示,请计算两者的相关系数月月份份1 12 23 34 45 56 67 78 89 9101011111212气气温温-4.74.7-2.32.34.44.413.13.2 220.20.2 224.24.2 226.26.0 024.24.
6、6 619.19.5 512.12.5 54.04.0-2.82.8地地温温-3.63.6-1.41.45.15.114.14.5 522.22.3 326.26.9 928.28.2 226.26.5 521.21.1 113.13.4 44.64.6-1.91.9第13页,本讲稿共48页 用导出公式用导出公式第14页,本讲稿共48页相关系数计算表月份月份月份月份气温气温气温气温(x)(x)(x)(x)地温地温地温地温(y)(y)(y)(y)xyxyxyxyx x x x2 2 2 2y y y y2 2 2 21 1 1 1-4.7-4.7-4.7-4.7-3.6-3.6-3.6-3.6
7、16.92 16.92 16.92 16.92 22.09 22.09 22.09 22.09 12.96 12.96 12.96 12.96 2 2 2 2-2.3-2.3-2.3-2.3-1.4-1.4-1.4-1.4 3.22 3.22 3.22 3.22 5.29 5.29 5.29 5.29 1.96 1.96 1.96 1.96 3 3 3 34.4 4.4 4.4 4.4 5.1 5.1 5.1 5.1 22.44 22.44 22.44 22.44 19.36 19.36 19.36 19.36 26.01 26.01 26.01 26.01 4 4 4 413.2 13.2
8、13.2 13.2 14.5 14.5 14.5 14.5 191.40 191.40 191.40 191.40 174.24 174.24 174.24 174.24 210.25 210.25 210.25 210.25 5 5 5 520.2 20.2 20.2 20.2 22.3 22.3 22.3 22.3 450.46 450.46 450.46 450.46 408.04 408.04 408.04 408.04 497.29 497.29 497.29 497.29 6 6 6 624.2 24.2 24.2 24.2 26.9 26.9 26.9 26.9 650.98 6
9、50.98 650.98 650.98 585.64 585.64 585.64 585.64 723.61 723.61 723.61 723.61 7 7 7 726.0 26.0 26.0 26.0 28.2 28.2 28.2 28.2 733.20 733.20 733.20 733.20 676.00 676.00 676.00 676.00 795.24 795.24 795.24 795.24 8 8 8 824.6 24.6 24.6 24.6 26.5 26.5 26.5 26.5 651.90 651.90 651.90 651.90 605.16 605.16 605.
10、16 605.16 702.25 702.25 702.25 702.25 9 9 9 919.5 19.5 19.5 19.5 21.1 21.1 21.1 21.1 411.45 411.45 411.45 411.45 380.25 380.25 380.25 380.25 445.21 445.21 445.21 445.21 1010101012.5 12.5 12.5 12.5 13.4 13.4 13.4 13.4 167.50 167.50 167.50 167.50 156.25 156.25 156.25 156.25 179.56 179.56 179.56 179.56
11、 111111114.0 4.0 4.0 4.0 4.6 4.6 4.6 4.6 18.40 18.40 18.40 18.40 16.00 16.00 16.00 16.00 21.16 21.16 21.16 21.16 12121212-2.8-2.8-2.8-2.8-1.9-1.9-1.9-1.9 5.32 5.32 5.32 5.32 7.84 7.84 7.84 7.84 3.61 3.61 3.61 3.61 总和总和总和总和138.8 138.8 138.8 138.8 155.7 155.7 155.7 155.7 3323.19 3323.19 3323.19 3323.1
12、9 3056.16 3056.16 3056.16 3056.16 3619.11 3619.11 3619.11 3619.11 21611.1621611.1621611.1621611.16第15页,本讲稿共48页第16页,本讲稿共48页伦敦的月平均气温与降水量伦敦的月平均气温与降水量 资料来源:http:/www.cwb.gov.tw/V4/climate/wta_station/wta20.htm 相关分析实例相关分析实例第17页,本讲稿共48页根据表3.1.1中的数据,我们可以利用公式(3.1.1),计算伦敦市月平均气温(T)与降水量(P)之间的相关系数:计算结果表明,伦敦市的月平
13、均气温(t)与降水量(p)之间呈负相关,即异向相关。第18页,本讲稿共48页计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。第19页,本讲稿共48页相关系数的检验:相关系数的检验:相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。第20页,本讲稿共48页0.100.100.050.050.020.020.010.010.0010.0011 12 23 34 45 56 67 78 89 9
14、1010111112120.987690.987690.900000.900000.80540.80540.72930.72930.66940.66940.62150.62150.58220.58220.54940.54940.52140.52140.49730.49730.47620.47620.45750.45750.996920.996920.950000.950000.87830.87830.81140.81140.75450.75450.70670.70670.66640.66640.63190.63190.60210.60210.57600.57600.55290.55290.53
15、240.5324 0.9995070.9995070.980000.980000.934330.934330.88220.88220.83290.83290.78870.78870.74930.74930.71550.71550.68510.68510.65810.65810.63390.63390.61200.6120 0.9998770.9998770.990000.990000.958730.958730.917200.917200.87450.87450.83430.83430.79770.79770.76460.76460.73480.73480.70790.70790.68350.
16、68350.66140.66140.9999980.9999980.9990000.9990000.9911600.9911600.974060.974060.950740.950740.924930.924930.89820.89820.87210.87210.84710.84710.82330.82330.80100.80100.78000.7800表表3.1.3 3.1.3 检验相关系数检验相关系数 的临界值(的临界值()表)表 第21页,本讲稿共48页 检验相关系数检验相关系数 0 0的临界值(的临界值(r r)表 左边的左边的f f值称为自由度,其数值为值称为自由度,其数值为f=n-
17、2f=n-2,这里,这里nn为样本数;上方的为样本数;上方的 代表不同的置信水平;表内代表不同的置信水平;表内的数值代表不同的置信水平下相关系数的数值代表不同的置信水平下相关系数=0=0的临的临界值,即界值,即rara;公式;公式p=p=r rr r =的意思的意思是当所计算的相关系数是当所计算的相关系数r r的绝对值大于在的绝对值大于在aa水水平下的临界值平下的临界值r r 时,两要素不相关(即时,两要素不相关(即=0)=0)的的可能性只有可能性只有a a。一般而言,当一般而言,当r rr r 时,则认为两要素不相关,时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系这时的
18、样本相关系数就不能反映两要素之间的关系第22页,本讲稿共48页(1)对伦敦市月平均气温(T)与降水量(P)之间的相关系数,f=12-2=10,在显著性水平 上,查表3.1.3,得知:。因为 ,所以,伦敦市月平均气温(T)与降水量(P)之间的相关性并不显著。第23页,本讲稿共48页2、顺序(等级)相关系数计算第24页,本讲稿共48页月份月份气温气温(x)(x)平均气温平均气温顺序号顺序号T Ts s地温地温(y)(y)5cm5cm平均地温平均地温顺序号顺序号T Tdsdsd=Td=Ts s-T-Tdsdsd d2 21 1-4.7-4.7 12 12-3.6-3.6 12 12 0.00 0.0
19、0 0.00 0.00 2 2-2.3-2.3 10 10-1.4-1.4 10 10 0.00 0.00 0.00 0.00 3 34.4 4.4 8 8 5.1 5.1 8 8 0.00 0.00 0.00 0.00 4 413.2 13.2 6 6 14.5 14.5 6 6 0.00 0.00 0.00 0.00 5 520.2 20.2 4 4 22.3 22.3 4 4 0.00 0.00 0.00 0.00 6 624.2 24.2 3 3 26.9 26.9 2 2 1.00 1.00 1.00 1.00 7 726.0 26.0 1 1 28.2 28.2 1 1 0.00
20、0.00 0.00 0.00 8 824.6 24.6 2 2 26.5 26.5 3 3-1.00-1.00 1.00 1.00 9 919.5 19.5 5 5 21.1 21.1 5 5 0.00 0.00 0.00 0.00 101012.5 12.5 7 7 13.4 13.4 7 7 0.00 0.00 0.00 0.00 11114.0 4.0 9 9 4.6 4.6 9 9 0.00 0.00 0.00 0.00 1212-2.8-2.8 11 11-1.9-1.9 11 11 0.00 0.00 0.00 0.00 合计合计2.00 2.00 第25页,本讲稿共48页第26页
21、,本讲稿共48页n n 显著水平显著水平 nn 显著水平显著水平 0.050.05 0.010.01 0.050.050.010.014 41.0001.000-16160.4250.4250.6010.6015 50.9000.9001.0001.00018180.3990.3990.5640.5646 60.8290.8290.9430.94320200.3770.3770.5340.5347 70.7140.7140.8930.89322220.3590.3590.5080.5088 80.6430.6430.8330.83324240.3430.3430.4850.4859 90.60
22、00.6000.7830.78326260.3290.3290.4650.46510100.5640.5640.7460.74628280.3170.3170.4480.44812120.4560.4560.7120.71230300.3060.3060.4320.43214140.4560.4560.6450.645-n代表样本个数,代表不同的置信水平,也称显著水平,表中的数值为临界值 。秩相关系数的检验秩相关系数的检验表表3.1.5 3.1.5 秩相关系数检验的临界值秩相关系数检验的临界值 第27页,本讲稿共48页在上例中,n=31,表中没有给出相应的样本个数下的临界值 ,但是同一显著水平
23、下,随着样本数的增大,临界值 减少。在n=30时,查表得:0.432,由于=0.806 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。第28页,本讲稿共48页(二)简单非线性相(二)简单非线性相关程度的度量关程度的度量 表示简单非线性相关程表示简单非线性相关程度的统计量,通常用相度的统计量,通常用相关指数关指数R Ryxyx来度量来度量第29页,本讲稿共48页相关指数的性质,随相关曲线形状的不同而异:相关指数的性质,随相关曲线形状的不同而异:相关指数的分布范围介于相关指数的分布范围介于0 0到到1 1之间,即之间,即0R0Ryxyx1
24、1相关指数的值大,两个要素(变量)间的相关程度相关指数的值大,两个要素(变量)间的相关程度越密切。当越密切。当R Ryxyx1 1时,表示两个要素间为完全曲线时,表示两个要素间为完全曲线相关;当相关;当R Ryxyx0 0时,表示两个要素间为完全无曲线时,表示两个要素间为完全无曲线相关相关相关指数必大于或至少等于用同一批资料所求得的相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对值,即相关系数的绝对值,即R Ryxyx rr R Ryxyx的性质与上述情况基本相同,但在通常情况下,的性质与上述情况基本相同,但在通常情况下,R Ryxyx与与R Rxyxy不相等,仅当完全相关或完全无关
25、时,两不相等,仅当完全相关或完全无关时,两者才相等者才相等第30页,本讲稿共48页(三)多要素相关与相关矩阵(三)多要素相关与相关矩阵 如果问题涉及到多个要素(如果问题涉及到多个要素(n n个),则对于其中任何两个个),则对于其中任何两个要素要素x xi i和和x xj j,都可以按照下面的公式计算。得到多要素的,都可以按照下面的公式计算。得到多要素的相关系数矩阵相关系数矩阵第31页,本讲稿共48页 多要素的相关系数矩多要素的相关系数矩阵阵 对角线数值为对角线数值为1 1的对称的对称矩阵矩阵第32页,本讲稿共48页三、多要素间相关程度的测度地理系统是一种多要素的复杂巨系统,其中一个要素地理系统
26、是一种多要素的复杂巨系统,其中一个要素的变化必然影响到其它各要素的变化。在多要素所构的变化必然影响到其它各要素的变化。在多要素所构成的地理系统中,当我们研究某一个要素对另一个要成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数素的影响或相关程度时,把其它要素的影响视为常数(保持不变(保持不变),即暂不考虑其它要素的影响,而单独,即暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称研究那两个要素之间的相互关系的密切程度时,则称为为偏相关偏相关。用以度量偏相关程度的统计量,称为。用以度量偏相关程度的统计量,称为偏相关系偏相关系数数
27、第33页,本讲稿共48页(一)偏相关系数的计算与检验 1.偏相关系数的计算 定义:在多要素所构成的地理系统中,先不考虑其它要素定义:在多要素所构成的地理系统中,先不考虑其它要素的影响,而单独研究两个要素之间的相互关系的密切程度,的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数关系数 偏相关系数,可利用单相关系数来计算。假设有三个偏相关系数,可利用单相关系数来计算。假设有三个要素要素x x1 1,x x2 2,x x3 3,其两两间单相关系数矩阵为,其两两间单相关系数矩阵为第34页,本讲
28、稿共48页因为相关系数矩阵是对称的,故在实际计算时,只要计算出r12,r13和r23即可。在偏相关分析中,常称这些单相关系数为零级相关系数。对于上述三个要素x1,x2,x3,它们之间的偏相关系数共有三个,即r123,r132,r231(下标点后面的数字,代表在计算偏相关系数时,保持不变量,如r123即表示x3保持不变)第35页,本讲稿共48页一级偏相关系数(三个要素)第36页,本讲稿共48页二级偏相关系数(四个要素)第37页,本讲稿共48页例如:对于某四个地理要素例如:对于某四个地理要素x x1 1,x x2 2,x x3 3,x x4 4的的2323个样个样本数据,经过计算得到了如下的单相关
29、系数矩阵:本数据,经过计算得到了如下的单相关系数矩阵:第38页,本讲稿共48页利用公式计算一级偏向关系数,如表所示:利用公式计算一级偏向关系数,如表所示:r r12341234r r13241324r r14231423r r23142314r r24132413r r34123412-0.170-0.1700.8020.8020.6350.635-0.187-0.1870.8210.821-0.337-0.337r r123123r r132132r r142142r r143143r r231231r r241241r r243243r r241241r r34342 20.8210.82
30、10.8080.8080.6470.6470.8950.895-0.8630.8630.9560.9560.9450.945-0.8750.8750.3710.371利用公式计算二级偏相关系数,如表所示:利用公式计算二级偏相关系数,如表所示:说明:四个要素的一级偏相关系数有说明:四个要素的一级偏相关系数有1212个,这里给出了个,这里给出了9 9个;二级偏相个;二级偏相关系数有关系数有6 6个,这里全部给出来了。个,这里全部给出来了。表表 一级偏相关系数一级偏相关系数 表表 二级偏相关系数二级偏相关系数 第39页,本讲稿共48页偏相关系数的性质偏相关系数具有下述性质:偏相关系数具有下述性质:偏
31、相关系数分布的范围在偏相关系数分布的范围在-1-1到到11之间,如当之间,如当r r1212 3 3 为正值时,为正值时,表示在表示在X X3 3固定时,固定时,X X1 1 与与X X2 2 之间为正相关;当之间为正相关;当r r1212 3 3 为负为负值时,表示在值时,表示在X X3 3 固定时,固定时,X X1 1 与与X X22之间为负相关。之间为负相关。偏相关系数的绝对值越大,表示其偏相关程度越大。偏相关系数的绝对值越大,表示其偏相关程度越大。例如,例如,r r1212 3 3=1=1,则表示当,则表示当X X3 3 固定时,固定时,X X1 1 与与X X22之间完全相关;之间完
32、全相关;当当r r1212 3 3=0=0时,表示当时,表示当X X3 3 固定时,固定时,X X1 1 与与X X2 2 之间完全之间完全无关无关 偏相关系数的绝对值必小于或最多等于由同一系列资料所求偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数(详见后述得的复相关系数(详见后述),即,即R R1 1 2323 r r1212 3 3第40页,本讲稿共48页 2.2.偏相关系数的显著性检验偏相关系数的显著性检验 偏相关系数的显著性检验,一般采用偏相关系数的显著性检验,一般采用t-t-检验法。其检验法。其统计量计算公式为统计量计算公式为 r r1212 3434 mm 为偏
33、相关系数,为偏相关系数,nn为样本数,为样本数,mm为自变量个为自变量个数数第41页,本讲稿共48页 譬如,偏相关系数譬如,偏相关系数r r2424 1313=0.821=0.821,由于,由于n=23n=23,m=3m=3 查查t t分布表,可得出不同显著水平上的临界值分布表,可得出不同显著水平上的临界值t t,若,若t tt t。则表示偏相关显著;反之,。则表示偏相关显著;反之,t tt t,则偏相关,则偏相关不显著。在自由度为不显著。在自由度为23-3-1=1923-3-1=19时,查表得时,查表得t t0.0010.001=3.883=3.883,所以,所以t tt t ,这表明在置信
34、度水平,这表明在置信度水平a=0.001a=0.001上,偏相关系数上,偏相关系数r r2424 1313是显著的是显著的第42页,本讲稿共48页(二)复相关系数的计算与检验 1.1.复相关系数的计算复相关系数的计算 复相关系数:反映几个要素与某一个要素之间复相关系数:反映几个要素与某一个要素之间 的复相的复相关程度关程度 。复相关系数,可以利用单相关系数和偏相关系数求得复相关系数,可以利用单相关系数和偏相关系数求得 设设YY为因变量,为因变量,X X1 1,X X2 2,X Xk k 为自变量,则将为自变量,则将YY与与X X1 1,X X2 2,X Xk k 之间的复相关系数记为之间的复相
35、关系数记为R Ry y 1212 k k。其计算公式。其计算公式如下如下 当有两个自变量时当有两个自变量时第43页,本讲稿共48页 当有当有3 3个自变量时个自变量时 当有当有k k个自变量时个自变量时第44页,本讲稿共48页关于复相关系数的性质,可以概括为如下几点:复相关系数介于复相关系数介于00到到11之间,即之间,即0R0Ry y 1212 k k11复相关系数越大,则表明要素(变量复相关系数越大,则表明要素(变量)之间之间的相关程度越密切。复相关系数为的相关程度越密切。复相关系数为1 1,表示,表示完全相关;复相关系数为完全相关;复相关系数为0 0,表示完全无关,表示完全无关复相关系数
36、必大于或至少等于单相关系数的复相关系数必大于或至少等于单相关系数的绝对值绝对值第45页,本讲稿共48页 2.2.复相关系数的显著性检验复相关系数的显著性检验(F(F检验法检验法)n n为样本数,为样本数,K K为自变量个数为自变量个数第46页,本讲稿共48页 如如R R4 4 123123=0.974=0.974,n=23n=23,k=3k=3,故,故第47页,本讲稿共48页查查F-F-检验的临界值表(见本书附表六检验的临界值表(见本书附表六),可以得出不,可以得出不同显著水平上的临界值同显著水平上的临界值F F 若若F FF F0.010.01,则表示复相关在置信度水平,则表示复相关在置信度
37、水平a=0.01a=0.01上显著,上显著,称为极显著称为极显著 若若F F0.050.05FFFF0.010.01,则表示复相关在置信度水平,则表示复相关在置信度水平a=0.05a=0.05上显著上显著 若若F F0.100.10FFFF0.050.05,则表示复相关在置信度水平,则表示复相关在置信度水平a=0.10a=0.10上显上显著著 若若F FF F0.100.10,则表示复相关不显著,即因变量,则表示复相关不显著,即因变量YY与与KK个个自变量之间的关系不密切。在上例中,自变量之间的关系不密切。在上例中,F=120.1907F=120.1907F F0.010.01=5.0103=5.0103,故复相关达到了极显著水平,故复相关达到了极显著水平第48页,本讲稿共48页