《计量地理学第三章统计分析方法相关分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《计量地理学第三章统计分析方法相关分析优秀PPT.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量地理学第三章统计分析方法相关分析现在学习的是第1页,共48页1地理要素间的相关分析2地理要素间的回归分析3时间序列分析法4系统聚类分析方法5主成分分析方法6马尔可夫预测方法7地理系统的空间趋势面分析现在学习的是第2页,共48页1地理要素间的相关分析地理相关的意义地理相关程度的度量方法相关系数的显著性检验多要素间相关程度的测度现在学习的是第3页,共48页地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数的计算与检验来完成的现在学习的是第4页,共48页一、地理相关的意义相关与地理相关相关与地理相关 相关是指两个或两个
2、以上变数间相互关系是否密切。在研究相关是指两个或两个以上变数间相互关系是否密切。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。相关分析仅限于测定两个或两个以上变数视实际需要确定。相关分析仅限于测定两个或两个以上变数具有相关关系者,其主要目的是计算出表示两个或两个以上具有相关关系者,其主要目的是计算出表示两个或两个以上变数间的相关程度和性质变数间的相关程度和性质 地理相关,就是应用相关分析法来研究各地理要素间的相互地理相关,就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标关系和联系强度的一种度量
3、指标 现在学习的是第5页,共48页地理要素间的关系函数关系:确定性的关系,这种关系在地理各要素间较少见,这是因为许多地理要素的变化具有随机性的缘故;相关关系:即要素间既存在密切的关系,但又不能由一个(或几个)要素(或变量)的值明确地求出另一个要素(变量)的值现在学习的是第6页,共48页现在学习的是第7页,共48页二、地理相关程度的度量方法(一)简单直线相关程度的度量相关程度研究两个地理要素之间的相互关系是否密切研究两个地理要素之间的相互关系是否密切相关方向正相关:正相关:y y值随值随x x的增加而变大或随的增加而变大或随x x的减少而变小的减少而变小负相关:负相关:y y值随值随x x的增加
4、而变小或随的增加而变小或随x x的减少而增大的减少而增大现在学习的是第8页,共48页1、一般常用相关系数的计算现在学习的是第9页,共48页rxy为要素x与y之间的相关系数,它就是表示该两要素之间相关程度的统计指标,其值在-1,1区间之内rxy0,表示正相关,即两要素同向发展rxy0,表示负相关,即两要素异向发展rxy的绝对值越接近于1,表示两要素的关系越密切;越接近于0,表示两要素的关系越不密切现在学习的是第10页,共48页现在学习的是第11页,共48页现在学习的是第12页,共48页 举例,北京市多年各月平均气温与举例,北京市多年各月平均气温与5cm5cm深的平均地温,深的平均地温,如表所示,
5、请计算两者的相关系数如表所示,请计算两者的相关系数月份月份1 12 23 34 45 56 67 78 89 9101011111212气温气温-4.74.7-2.32.34.44.413.13.2 220.20.2 224.24.2 226.26.0 024.24.6 619.19.5 512.12.5 54.04.0-2.82.8地温地温-3.63.6-1.41.45.15.114.14.5 522.22.3 326.26.9 928.28.2 226.26.5 521.21.1 113.13.4 44.64.6-1.91.9现在学习的是第13页,共48页 用导出公式现在学习的是第14页,
6、共48页相关系数计算表月份月份月份月份气温气温气温气温(x)(x)(x)(x)地温地温地温地温(y)(y)(y)(y)xyxyxyxyx x x x2 2 2 2y y y y2 2 2 21 1 1 1-4.7-4.7-4.7-4.7-3.6-3.6-3.6-3.6 16.92 16.92 16.92 16.92 22.09 22.09 22.09 22.09 12.96 12.96 12.96 12.96 2 2 2 2-2.3-2.3-2.3-2.3-1.4-1.4-1.4-1.4 3.22 3.22 3.22 3.22 5.29 5.29 5.29 5.29 1.96 1.96 1.9
7、6 1.96 3 3 3 34.4 4.4 4.4 4.4 5.1 5.1 5.1 5.1 22.44 22.44 22.44 22.44 19.36 19.36 19.36 19.36 26.01 26.01 26.01 26.01 4 4 4 413.2 13.2 13.2 13.2 14.5 14.5 14.5 14.5 191.40 191.40 191.40 191.40 174.24 174.24 174.24 174.24 210.25 210.25 210.25 210.25 5 5 5 520.2 20.2 20.2 20.2 22.3 22.3 22.3 22.3 450.
8、46 450.46 450.46 450.46 408.04 408.04 408.04 408.04 497.29 497.29 497.29 497.29 6 6 6 624.2 24.2 24.2 24.2 26.9 26.9 26.9 26.9 650.98 650.98 650.98 650.98 585.64 585.64 585.64 585.64 723.61 723.61 723.61 723.61 7 7 7 726.0 26.0 26.0 26.0 28.2 28.2 28.2 28.2 733.20 733.20 733.20 733.20 676.00 676.00
9、676.00 676.00 795.24 795.24 795.24 795.24 8 8 8 824.6 24.6 24.6 24.6 26.5 26.5 26.5 26.5 651.90 651.90 651.90 651.90 605.16 605.16 605.16 605.16 702.25 702.25 702.25 702.25 9 9 9 919.5 19.5 19.5 19.5 21.1 21.1 21.1 21.1 411.45 411.45 411.45 411.45 380.25 380.25 380.25 380.25 445.21 445.21 445.21 445
10、.21 1010101012.5 12.5 12.5 12.5 13.4 13.4 13.4 13.4 167.50 167.50 167.50 167.50 156.25 156.25 156.25 156.25 179.56 179.56 179.56 179.56 111111114.0 4.0 4.0 4.0 4.6 4.6 4.6 4.6 18.40 18.40 18.40 18.40 16.00 16.00 16.00 16.00 21.16 21.16 21.16 21.16 12121212-2.8-2.8-2.8-2.8-1.9-1.9-1.9-1.9 5.32 5.32 5
11、.32 5.32 7.84 7.84 7.84 7.84 3.61 3.61 3.61 3.61 总和总和总和总和138.8 138.8 138.8 138.8 155.7 155.7 155.7 155.7 3323.19 3323.19 3323.19 3323.19 3056.16 3056.16 3056.16 3056.16 3619.11 3619.11 3619.11 3619.11 21611.1621611.1621611.1621611.16现在学习的是第15页,共48页现在学习的是第16页,共48页伦敦的月平均气温与降水量伦敦的月平均气温与降水量 资料来源:http:/w
12、ww.cwb.gov.tw/V4/climate/wta_station/wta20.htm 相关分析实例相关分析实例现在学习的是第17页,共48页根据表3.1.1中的数据,我们可以利用公式(3.1.1),计算伦敦市月平均气温(T)与降水量(P)之间的相关系数:计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。现在学习的是第18页,共48页计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。现在学习的是第19页,共48页相关系数的检验:相关系数的检验:相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而
13、不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。现在学习的是第20页,共48页0.100.100.050.050.020.020.010.010.0010.0011 12 23 34 45 56 67 78 89 91010111112120.987690.987690.900000.900000.80540.80540.72930.72930.66940.66940.62150.62150.58220.58220.54940.54940.52140.52140.49730.49730.47620.476
14、20.45750.45750.996920.996920.950000.950000.87830.87830.81140.81140.75450.75450.70670.70670.66640.66640.63190.63190.60210.60210.57600.57600.55290.55290.53240.5324 0.9995070.9995070.980000.980000.934330.934330.88220.88220.83290.83290.78870.78870.74930.74930.71550.71550.68510.68510.65810.65810.63390.63
15、390.61200.6120 0.9998770.9998770.990000.990000.958730.958730.917200.917200.87450.87450.83430.83430.79770.79770.76460.76460.73480.73480.70790.70790.68350.68350.66140.66140.9999980.9999980.9990000.9990000.9911600.9911600.974060.974060.950740.950740.924930.924930.89820.89820.87210.87210.84710.84710.823
16、30.82330.80100.80100.78000.7800表表3.1.3 3.1.3 检验相关系数检验相关系数 的临界值(的临界值()表)表 现在学习的是第21页,共48页 检验相关系数0的临界值(r)表 左边的左边的f f值称为自由度,其数值为值称为自由度,其数值为f=n-2f=n-2,这里,这里nn为样本数;上方的为样本数;上方的 代表不同的置信水平;表内代表不同的置信水平;表内的数值代表不同的置信水平下相关系数的数值代表不同的置信水平下相关系数=0=0的临的临界值,即界值,即rara;公式;公式p=p=r rr r =的意思的意思是当所计算的相关系数是当所计算的相关系数r r的绝对值
17、大于在的绝对值大于在aa水平水平下的临界值下的临界值r r 时,两要素不相关(即时,两要素不相关(即=0)=0)的可能性的可能性只有只有a a。一般而言,当一般而言,当r rr r 时,则认为两要素不相关,时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关这时的样本相关系数就不能反映两要素之间的关系系现在学习的是第22页,共48页(1)对伦敦市月平均气温(T)与降水量(P)之间的相关系数,f=12-2=10,在显著性水平 上,查表3.1.3,得知:。因为 ,所以,伦敦市月平均气温(T)与降水量(P)之间的相关性并不显著。现在学习的是第23页,共48页2、顺序(等级)相关系数计算
18、现在学习的是第24页,共48页月份月份气温气温(x)(x)平均气温平均气温顺序号顺序号T Ts s地温地温(y)(y)5cm5cm平均地温平均地温顺序号顺序号T Tdsdsd=Td=Ts s-T-Tdsdsd d2 21 1-4.7-4.7 12 12-3.6-3.6 12 12 0.00 0.00 0.00 0.00 2 2-2.3-2.3 10 10-1.4-1.4 10 10 0.00 0.00 0.00 0.00 3 34.4 4.4 8 8 5.1 5.1 8 8 0.00 0.00 0.00 0.00 4 413.2 13.2 6 6 14.5 14.5 6 6 0.00 0.00
19、 0.00 0.00 5 520.2 20.2 4 4 22.3 22.3 4 4 0.00 0.00 0.00 0.00 6 624.2 24.2 3 3 26.9 26.9 2 2 1.00 1.00 1.00 1.00 7 726.0 26.0 1 1 28.2 28.2 1 1 0.00 0.00 0.00 0.00 8 824.6 24.6 2 2 26.5 26.5 3 3-1.00-1.00 1.00 1.00 9 919.5 19.5 5 5 21.1 21.1 5 5 0.00 0.00 0.00 0.00 101012.5 12.5 7 7 13.4 13.4 7 7 0.
20、00 0.00 0.00 0.00 11114.0 4.0 9 9 4.6 4.6 9 9 0.00 0.00 0.00 0.00 1212-2.8-2.8 11 11-1.9-1.9 11 11 0.00 0.00 0.00 0.00 合计合计2.00 2.00 现在学习的是第25页,共48页现在学习的是第26页,共48页n n 显著水平显著水平 nn 显著水平显著水平 0.050.05 0.010.01 0.050.050.010.014 41.0001.000-16160.4250.4250.6010.6015 50.9000.9001.0001.00018180.3990.3990.5
21、640.5646 60.8290.8290.9430.94320200.3770.3770.5340.5347 70.7140.7140.8930.89322220.3590.3590.5080.5088 80.6430.6430.8330.83324240.3430.3430.4850.4859 90.6000.6000.7830.78326260.3290.3290.4650.46510100.5640.5640.7460.74628280.3170.3170.4480.44812120.4560.4560.7120.71230300.3060.3060.4320.43214140.456
22、0.4560.6450.645-n代表样本个数,代表不同的置信水平,也称显著水平,表中的数值为临界值 。秩相关系数的检验秩相关系数的检验表表3.1.5 3.1.5 秩相关系数检验的临界值秩相关系数检验的临界值 现在学习的是第27页,共48页在上例中,n=31,表中没有给出相应的样本个数下的临界值 ,但是同一显著水平下,随着样本数的增大,临界值 减少。在n=30时,查表得:0.432,由于=0.806 0.432,所以在=0.01的置信水平上来看,中国大陆各省(直辖市、自治区)人口规模与GDP是等级相关的。现在学习的是第28页,共48页(二)简单非线性相关程度的度量 表示简单非线性相关程表示简单
23、非线性相关程度的统计量,通常用相度的统计量,通常用相关指数关指数R Ryxyx来度量来度量现在学习的是第29页,共48页相关指数的性质,随相关曲线形状的不同而异:相关指数的分布范围介于相关指数的分布范围介于0 0到到1 1之间,即之间,即0R0Ryxyx11相关指数的值大,两个要素(变量)间的相关程度相关指数的值大,两个要素(变量)间的相关程度越密切。当越密切。当R Ryxyx1 1时,表示两个要素间为完全曲线时,表示两个要素间为完全曲线相关;当相关;当R Ryxyx0 0时,表示两个要素间为完全无曲线时,表示两个要素间为完全无曲线相关相关相关指数必大于或至少等于用同一批资料所求得的相关指数必
24、大于或至少等于用同一批资料所求得的相关系数的绝对值,即相关系数的绝对值,即R Ryxyx rr R Ryxyx的性质与上述情况基本相同,但在通常情况下,的性质与上述情况基本相同,但在通常情况下,R Ryxyx与与R Rxyxy不相等,仅当完全相关或完全无关时,两不相等,仅当完全相关或完全无关时,两者才相等者才相等现在学习的是第30页,共48页(三)多要素相关与相关矩阵 如果问题涉及到多个要素(如果问题涉及到多个要素(n n个),则对于其中任何两个个),则对于其中任何两个要素要素x xi i和和x xj j,都可以按照下面的公式计算。得到多要素的,都可以按照下面的公式计算。得到多要素的相关系数矩
25、阵相关系数矩阵现在学习的是第31页,共48页 多要素的相关系数矩阵 对角线数值为对角线数值为1 1的对称的对称矩阵矩阵现在学习的是第32页,共48页三、多要素间相关程度的测度地理系统是一种多要素的复杂巨系统,其中一个要素地理系统是一种多要素的复杂巨系统,其中一个要素的变化必然影响到其它各要素的变化。在多要素所构的变化必然影响到其它各要素的变化。在多要素所构成的地理系统中,当我们研究某一个要素对另一个要成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数素的影响或相关程度时,把其它要素的影响视为常数(保持不变(保持不变),即暂不考虑其它要素的影响,而单独,
26、即暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称研究那两个要素之间的相互关系的密切程度时,则称为为偏相关。用以度量偏相关程度的统计量,称为。用以度量偏相关程度的统计量,称为偏相关系数现在学习的是第33页,共48页(一)偏相关系数的计算与检验1.偏相关系数的计算 定义:在多要素所构成的地理系统中,先不考虑其它要素定义:在多要素所构成的地理系统中,先不考虑其它要素的影响,而单独研究两个要素之间的相互关系的密切程度,的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系
27、数关系数 偏相关系数,可利用单相关系数来计算。假设有三个要偏相关系数,可利用单相关系数来计算。假设有三个要素素x x1,x x2 2,x x3 3,其两两间单相关系数矩阵为,其两两间单相关系数矩阵为现在学习的是第34页,共48页因为相关系数矩阵是对称的,故在实际计算时,只要计算出r12,r13和r23即可。在偏相关分析中,常称这些单相关系数为零级相关系数。对于上述三个要素x1,x2,x3,它们之间的偏相关系数共有三个,即r123,r132,r231(下标点后面的数字,代表在计算偏相关系数时,保持不变量,如r123即表示x3保持不变)现在学习的是第35页,共48页一级偏相关系数(三个要素)现在学
28、习的是第36页,共48页二级偏相关系数(四个要素)现在学习的是第37页,共48页例如:对于某四个地理要素例如:对于某四个地理要素x x1,x x2,x x3,x x4 4的的2323个个样本数据,经过计算得到了如下的单相关系数矩阵:样本数据,经过计算得到了如下的单相关系数矩阵:现在学习的是第38页,共48页利用公式计算一级偏向关系数,如表所示:r r12341234r r13241324r r14231423r r23142314r r24132413r r34123412-0.170-0.1700.8020.8020.6350.635-0.187-0.1870.8210.821-0.337-
29、0.337r r123123r r132132r r142142r r143143r r231231r r241241r r243243r r241241r r34342 20.8210.8210.8080.8080.6470.6470.8950.895-0.8630.8630.9560.9560.9450.945-0.8750.8750.3710.371利用公式计算二级偏相关系数,如表所示:利用公式计算二级偏相关系数,如表所示:说明:四个要素的一级偏相关系数有说明:四个要素的一级偏相关系数有1212个,这里给出了个,这里给出了9 9个;二级偏相个;二级偏相关系数有关系数有6 6个,这里全部给
30、出来了。个,这里全部给出来了。表表 一级偏相关系数一级偏相关系数 表表 二级偏相关系数二级偏相关系数 现在学习的是第39页,共48页偏相关系数的性质偏相关系数具有下述性质:偏相关系数分布的范围在偏相关系数分布的范围在-1-1到到11之间,如当之间,如当r r1212 3 3 为正值为正值时,表示在时,表示在X X3 3固定时,固定时,X X1 1 与与X X2 2 之间为正相关;当之间为正相关;当r r1212 3 3 为负为负值时,表示在值时,表示在X X3 3 固定时,固定时,X X1 1 与与X X22之间为负相关。之间为负相关。偏相关系数的绝对值越大,表示其偏相关程度越大。偏相关系数的
31、绝对值越大,表示其偏相关程度越大。例如,例如,r r1212 3 3=1=1,则表示当,则表示当X X3 3 固定时,固定时,X X1 1 与与X X22之间完全相关;之间完全相关;当当r r1212 3 3=0=0时,表示当时,表示当X X3 3 固定时,固定时,X X1 1 与与X X2 2 之间完全之间完全无关无关 偏相关系数的绝对值必小于或最多等于由同一系列资料所偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数(详见后述求得的复相关系数(详见后述),即,即R R1 1 2323 r r1212 3 3现在学习的是第40页,共48页 2.偏相关系数的显著性检验 偏相关系
32、数的显著性检验,一般采用偏相关系数的显著性检验,一般采用t-t-检验法。其检验法。其统计量计算公式为统计量计算公式为 r r1212 3434 mm 为偏相关系数,为偏相关系数,nn为样本数,为样本数,mm为自变量个为自变量个数数现在学习的是第41页,共48页 譬如,偏相关系数r2413=0.821,由于n=23,m=3 查t分布表,可得出不同显著水平上的临界值t,若tt。则表示偏相关显著;反之,tt,则偏相关不显著。在自由度为23-3-1=19时,查表得t0.001=3.883,所以tt,这表明在置信度水平a=0.001上,偏相关系数r2413是显著的现在学习的是第42页,共48页(二)复相
33、关系数的计算与检验 1.复相关系数的计算 复相关系数:反映几个要素与某一个要素之间复相关系数:反映几个要素与某一个要素之间 的复相的复相关程度关程度 。复相关系数,可以利用单相关系数和偏相关系数求得复相关系数,可以利用单相关系数和偏相关系数求得 设设YY为因变量,为因变量,X X1 1,X X2 2,X Xk k 为自变量,则将为自变量,则将YY与与X X1 1,X X2 2,X Xk k 之间的复相关系数记为之间的复相关系数记为R Ry y 1212 k k。其计算公式。其计算公式如下如下 当有两个自变量时当有两个自变量时现在学习的是第43页,共48页 当有3个自变量时 当有k个自变量时现在
34、学习的是第44页,共48页关于复相关系数的性质,可以概括为如下几点:复相关系数介于0到1之间,即0Ry12k1复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关复相关系数必大于或至少等于单相关系数的绝对值现在学习的是第45页,共48页 2.复相关系数的显著性检验(F检验法)n为样本数,K为自变量个数现在学习的是第46页,共48页 如R4123=0.974,n=23,k=3,故现在学习的是第47页,共48页查查F-F-检验的临界值表(见本书附表六检验的临界值表(见本书附表六),可以得出,可以得出不同显著水平上的临界值不同显著水平上的
35、临界值F F 若若F FF F0.010.01,则表示复相关在置信度水平,则表示复相关在置信度水平a=0.01a=0.01上显著,上显著,称为极显著称为极显著 若若F F0.050.05FFFF0.010.01,则表示复相关在置信度水平,则表示复相关在置信度水平a=0.05a=0.05上显著上显著 若若F F0.100.10FFFF0.050.05,则表示复相关在置信度水平,则表示复相关在置信度水平a=0.10a=0.10上上显著显著 若若F FF F0.100.10,则表示复相关不显著,即因变量,则表示复相关不显著,即因变量YY与与KK个个自变量之间的关系不密切。在上例中,自变量之间的关系不密切。在上例中,F=120.1907F=120.1907F F0.010.01=5.0103=5.0103,故复相关达到了极显著水平,故复相关达到了极显著水平现在学习的是第48页,共48页