《spass课件教程第五章相关分析和回归分析.ppt》由会员分享,可在线阅读,更多相关《spass课件教程第五章相关分析和回归分析.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 回归分析与相关分析回归分析与相关分析第一节第一节 回归和相关的概念回归和相关的概念回归分析内容回归分析内容相关分析相关分析5.1 下下表表为为青青海海一一月月平平均均气气温温与与海海拔拔高高度度及及纬纬度度的的数数据据,试试分分析析一一月月平平均均气气温温与与海海拔拔高高度度,一一月月平平均均气气温温与与纬纬度度是是否否存存在在线线性性关关系系(计计算算一一月月气气温温分分别别与与海海拔拔高度和高度和纬纬度的度的简单简单相关系数相关系数)。)。测站一月气温海拔高度纬度昂欠-6.936432.2清水河-1744233.8玛多-16.942235共和-11.328436.3铁卜加-1
2、4.232037.1茫崖-12.331438.4托勒-18.233638.9伍道梁-17.346535.3察尔汗-10.426836.8吉迈-13.339733.8尖扎-6.420835.9西宁-8.622636.6从上表可知,一月气温与海拔高度和纬度的从上表可知,一月气温与海拔高度和纬度的相关系数相关系数分别为分别为-0.728和和-0.186,说明一,说明一月气温与海拔高度和纬度均呈负相关关系;进一步对照其所对应的显著性分别为月气温与海拔高度和纬度均呈负相关关系;进一步对照其所对应的显著性分别为0.0070.05,表明一月气温与海拔高度的相关性显著,而一月气温与,表明一月气温与海拔高度的相
3、关性显著,而一月气温与纬度的相关性不显著。纬度的相关性不显著。5.1 下下表表为为青青海海一一月月平平均均气气温温与与海海拔拔高高度度及及纬纬度度的的数数据据,试试分分析析一一月月平平均均气气温温与与海海拔拔高高度度和和纬纬度度的的偏偏相相关关系系数数(因因为为第第三三个个变变量量纬纬度度(海海拔拔)的的存存在在所所起起的的作作用用,可可能能会会影影响响纬纬度度(海海拔拔)与与一一月月平平均均温温度之度之间间的真的真实实关系)关系)。测站测站一月气温一月气温海拔高度海拔高度纬度纬度昂欠昂欠-6.936432.2清水河清水河-1744233.8玛多玛多-16.942235共和共和-11.3284
4、36.3铁卜加铁卜加-14.232037.1茫崖茫崖-12.331438.4托勒托勒-18.233638.9伍道梁伍道梁-17.346535.3察尔汗察尔汗-10.426836.8吉迈吉迈-13.339733.8尖扎尖扎-6.420835.9西宁西宁-8.622636.6将-0.728与-0.941对照;同时再与前面讲的例子对照看有什么不同从表中可知从表中可知-0.728是一月温度和海拔高度的简单相关系数;而是一月温度和海拔高度的简单相关系数;而-0.941是一是一月气温与海拔高度的偏相关系数月气温与海拔高度的偏相关系数将-0.186与-0.875对照;同时再与前面讲的例子对照看有什么不同5.
5、2 一一条条河河流流流流经经某某地地区区,其其降降水水量量X(mm)和和径径流流量量Y(mm)多多年年观观测测数数据据如如表表所所示示。试试建建立立Y与与X的的线线性性回回归归方方程程,并并根根据据降降水水量量预测预测径流量。径流量。Y Y25258181363633337070545420204444141441417575X X110110 184184 145145 122122 165165 1431437878 1291296262 130130 168168回归分析(一元线性回归)回归分析(一元线性回归)从表中可知从表中可知FF0.01(pt0.01(pF0.01(p0.01),说
6、明方程通过了显著性检验,说明),说明方程通过了显著性检验,说明鱼产鱼产量依投饵量、放养量的二元线性回归达到显著水平量依投饵量、放养量的二元线性回归达到显著水平系数检验表系数检验表从表中可知从表中可知X1和和X2对应的对应的t均大于均大于t0.01(p0.01),说明),说明投饵量和放养量对鱼投饵量和放养量对鱼产量的偏回归系数达极显著水平,偏回归系数通过显著性检验,即鱼产量与投饵量、产量的偏回归系数达极显著水平,偏回归系数通过显著性检验,即鱼产量与投饵量、放养量之间存在真实的多元线性关系。因此,所建方程为放养量之间存在真实的多元线性关系。因此,所建方程为Y=-4.349+0.584X1+2.96
7、4X27.3 一一个个地地区区的的地地理理要要素素Y的的变变化化可可能能受受到到地地理理因因素素X1,X2,X3,X4,X5,X6的的综综合合影影响响,请请根根据据样样本本观观测测数数据据,分分析析Y与与X之之间间是是否否存存在在线线性性关关系系,并并建建立立其其逐逐步步回回归归方程(最方程(最优优回回归归方程)方程)。y yx1x1x2x2x3x3x4x4x5x5x6x65.775395.775391.11.13.93.916.6516.6515.515.51.21.240.7563940.756394.382634.382631.71.75.25.238.6238.6236.236.22.
8、52.542.4821142.482112.272772.272771.61.64.84.865.665.661.161.14.54.555.1318755.131873.646373.646377.87.88.28.210.5610.569.59.51.11.144.6746544.674653.118333.118337 78.48.425.2225.2222.722.72.62.642.443642.44361.898011.898017.97.98.98.936.2136.2132.632.63.63.650.6070350.607033.420193.420196.16.16.76.
9、742.9642.9641.741.71.21.249.3234749.323471.534561.534567.27.27.97.969.8969.8968.468.41.51.565.0330865.033081.031031.031038.38.39.89.861.161.159.859.81.31.363.9423663.942360.092460.092467.27.27.87.898.4898.4895.395.33.23.272.6280872.62808逐步回归分析(最优回归)逐步回归分析(最优回归)方程检验表方程检验表从表中可知,方程最多引入变量从表中可知,方程最多引入变量X
10、6、X2、X5时其对应的时其对应的F值大于值大于F0.01(p0.01),说明方程通过了显著性检验,说明地理要素),说明方程通过了显著性检验,说明地理要素Y依地理因素依地理因素X6、X2、X5的逐步线性回归达到显著水平的逐步线性回归达到显著水平系数检验表系数检验表从表中可知引入自变量变量从表中可知引入自变量变量X6X6、X2X2、X5X5对应的对应的t t均大于均大于t t0.010.01(p0.01p0.01),说明地理),说明地理因素因素Y Y对地理要素对地理要素X6、X2、X5的偏回归系数达极显著水平即通过显著性检验;而其它的的偏回归系数达极显著水平即通过显著性检验;而其它的X1、X3、
11、X4的偏回归系数没有通过显著性检验,所以被剔除。则所见最优(逐步)回归的偏回归系数没有通过显著性检验,所以被剔除。则所见最优(逐步)回归方程为方程为Y=-11.675-0.103XY=-11.675-0.103X6 6-0.362X-0.362X2 2-0.419X-0.419X5 57.5 下下表表给给出出山山脉脉南南侧侧一一组组测测站站年年降降水水量量随随海海拔拔高高度度变变化化的的观观测测值值,试试建建立立年年降降水水量量依依海海拔拔高高度度的的非非线线性性回回归归方方程程(一一元元非非线线性回性回归问题归问题)。海拔高度年降水量22048035066047069151072764083
12、183095810409821280116814401022167098717908941830832一元非线性回归分析一元非线性回归分析线线性:性:Y=b0b b1 1X X二次曲二次曲线线:Y=bY=b0 0+b+b1 1X X2 2复合曲线:复合曲线:Y=bY=b0 0b b1 1X X或或lnYlnY=lnb=lnb0 0+Xlnb+Xlnb1 1增长:增长:Y=exp(bY=exp(b0 0+b+b1 1X)X)拟合对数:拟合对数:Y=bY=b0 0+b+b1 1lnXlnX三次(立方)模型:三次(立方)模型:Y=bY=b0 0+b+b1 1X+bX+b2 2X X2 2+b+b3
13、3X X3 3S:Y=exp(bS:Y=exp(b0 0+b+b1 1X)X)拟合指数方程拟合指数方程:Y=b:Y=b0 0+e+eb1Xb1X倒数(逆模型)倒数(逆模型):Y=b:Y=b0 0+b+b1 1/X/X拟合乘幂曲线拟合乘幂曲线:Y=b:Y=b0 0X Xb1b1LogistiLogisti:Y=I/(1/u)+b:Y=I/(1/u)+b0 0b b1 1X X)11种曲种曲线线形式形式曲线回归MODEL:MOD_3.Independent:年降水量 Dependent Mth Rsq d.f.F Sigf b0 b1 b2 b3 海拔高度 LIN .462 10 8.60 .01
14、5 -780.60 2.0951 海拔高度 LOG .484 10 9.39 .012 -10241 1672.91 海拔高度 INV .477 10 9.13 .013 2504.03-1.E+06 海拔高度 QUA .506 9 4.60 .042 -2676.6 6.9415 -.0029 海拔高度 CUB .559 8 3.39 .074 5011.03-23.623 .0356-2.E-05 海拔高度 COM .665 10 19.85 .001 63.4154 1.0030 海拔高度 POW .710 10 24.54 .001 6.7E-05 2.4296 海拔高度 S .719
15、 10 25.64 .000 8.9234-1781.4 海拔高度 GRO .665 10 19.85 .001 4.1497 .0030 海拔高度 EXP .665 10 19.85 .001 63.4154 .0030检验结果和系数检验结果和系数曲线形式曲线形式多元非线性回归多元非线性回归7.6 某某变变量量受受其其它它两两个个变变量量的的影影响响,其其中中X、Y这这两两个个 变变 量量 对对 y影影 响响 的的 函函 数数 表表 达达 式式 为为Z=a+bX+cX2+dY+eY2+fXY,根根据据下下面面的的数数据据计计算算这这个个关关系系式式(不不可可直直线线化化的的多多元元非非线线性
16、性回回归归,已已知知曲线的形式曲线的形式)注:多元多项式回归也用此方法注:多元多项式回归也用此方法Nonlinear Regression Summary Statistics Dependent Variable Z Source DF Sum of Squares Mean Square Regression 6 57582.84980 9597.14163 Residual 23 7.46820 .32470 Uncorrected Total 29 57590.31800 (Corrected Total)28 731.25559 R squared=1-Residual SS/Cor
17、rected SS=.98979 Asymptotic 95%Asymptotic Confidence Interval Parameter Estimate Std.Error Lower Upper a -106.3101780 34.167696857-176.9914441-35.62891183 b 171.99713390 325.14423560-500.6149636 844.60923136 c 289.56749562 756.29038887-1274.938373 1854.0733642 d 409.25962991 408.66543346-436.1292291 1254.6484890 e 721.82981869 1179.6036046-1718.366155 3162.0257927 f -1378.903174 1889.5079318-5287.648137 2529.8417894Z=-106.31+171.997X+c289.572+409.26Y+721.83Y2-1378.9XY