第八章相关分析和回归分析ppt课件.ppt

上传人:飞****2 文档编号:19375104 上传时间:2022-06-06 格式:PPT 页数:90 大小:670.50KB
返回 下载 相关 举报
第八章相关分析和回归分析ppt课件.ppt_第1页
第1页 / 共90页
第八章相关分析和回归分析ppt课件.ppt_第2页
第2页 / 共90页
点击查看更多>>
资源描述

《第八章相关分析和回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章相关分析和回归分析ppt课件.ppt(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第八章第八章 相关分析和回归分析相关分析和回归分析n8.1 相关分析和回归分析概述相关分析和回归分析概述n8.2 相关分析相关分析n8.3 直线回归直线回归n8.4 多元线性回归多元线性回归n8.5 逐步回归逐步回归n8.6 非线性回归非线性回归8.1 相关、回归分析概述相关、回归分析概述相关分析计算反映各变量之间相关密切程度和性质的统计数。相关分析计算反映各变量之间相关密切程度和性质的统计数。8.1.1 相关分析概述相关分析概述简单相关简单相关:研究两变量直线相关的密切程度和性质,也:研究两变量直线相关的密切程度和性质,也称直线相关。称直线相关。偏相关偏相关:排除其余的影响因子,求出:排除其

2、余的影响因子,求出x 与与y的纯相关,这的纯相关,这种相关称偏相关。种相关称偏相关。复相关复相关:研究一个变量与一组变量之间的相关性关系。:研究一个变量与一组变量之间的相关性关系。典型相关典型相关:研究两组变量的相关性。:研究两组变量的相关性。8.1.2 回归分析概述回归分析概述由自变数预测因变数的问题都叫回归分析。由自变数预测因变数的问题都叫回归分析。 相关分析反映各变量间相关密切程度,回归分析反映相关分析反映各变量间相关密切程度,回归分析反映因变量因变量(Y)和自变量和自变量(X)之间的数量关系,用回归方程表之间的数量关系,用回归方程表示。回归模型不一定是因果关系,自变量可多于一个。示。回

3、归模型不一定是因果关系,自变量可多于一个。回归分析依回归分析依自变量个数自变量个数的多少分为:的多少分为:一元回归和多元回归一元回归和多元回归因变量和自变量间因变量和自变量间关系的性质分关系的性质分:线性回归和非线性回归线性回归和非线性回归回归分析的回归分析的SAS过程:主要有过程:主要有REG(回归分析)回归分析) GLM (广义线性模型)(广义线性模型) 如由温度表水银柱高度(如由温度表水银柱高度(X)来估计温度()来估计温度(Y )时,)时,自变量实际上是依赖于因变量。自变量实际上是依赖于因变量。n1 简单相关简单相关n2 偏相关偏相关n3 复相关复相关8.2 相关分析相关分析(Anal

4、ysis of Correlation)补:秩相关补:秩相关1 简单相关简单相关简单相关简单相关: 是对有联系的两类事物(是对有联系的两类事物(x与与y)表面关)表面关系密切程度的衡量。系密切程度的衡量。(Simple Correlation)一、简单相关系数一、简单相关系数yxssyxyyxxyyxxr),cov()()()(221|r相关系数相关系数r(无单位)(无单位)的取值:的取值:即:即:11r二、简单相关系数二、简单相关系数r的显著性测验的显著性测验由由d.f=n-2查出相关系数的临界值查出相关系数的临界值r0.05 、r0.01(degree of freedom)SAS直接输出

5、直接输出prob|r|概率值,记为概率值,记为a.统计假设统计假设H0:总体相关系数:总体相关系数=0若若a 0.05,接受,接受H0,相关不显著,即总体相关不显著,即总体x与与y间不存在相关关系。间不存在相关关系。若若0.01a 0.05,拒绝,拒绝H0,相关显著,即总体相关显著,即总体x与与y间存在相关关系。间存在相关关系。若若a |R| under Ho: Rho=0 / N = 26 X Y X 1.00000 0.71019 0.0 0.0001 Y 0.71019 1.00000 0.0001 0.0结论:因结论:因r=0.71019,其出现的概率,其出现的概率=0.0001 |r

6、| x1x2x3x11.00000 0.799490.00100.775490.0018x20.799490.00101.00000 0.869310.0001x30.775490.00180.869310.00011.00000 CORR 过程过程1 Partial 变量:变量:x32 变量:变量:x1 x2 简单统计量简单统计量变变量量N均值均值标准偏差标准偏差总和总和最小值最小值最大值最大值偏方差偏方差偏标准偏差偏标准偏差x31315.738460.99544204.6000013.7000017.90000 x11328.6076920.18875371.900000.4000052.

7、30000177.2425913.31325x21315.484621.13420201.3000013.1000017.600000.342840.58552 Pearson 偏相关系数偏相关系数, N = 13 当当 H0: Partial Rho=0 时,时,Prob |r| x1x2x11.00000 0.401690.1956x20.401690.19561.00000 统计结论: r12=0.79949 p=0.0010.01 相关极显著 r13=0.77549 p=0.00180.01 相关极显著 r23=0.86931 p=0.00010.05 相关不显著 r13.2=0.27

8、108 p=0.271080.05 相关不显著实例:实例:p170例例8.2 8.2 腰果分期播种试验,采用腰果分期播种试验,采用1010天播种一次,每次天播种一次,每次播种播种1010粒。粒。19861986年年4 4月至月至19871987年年3 3月,共进行月,共进行3333次分期次分期播种。表播种。表1111是腰果种子发芽是腰果种子发芽“普遍期普遍期”天数、平均气天数、平均气温、平均最低气温、及平均最高气温的观察资料。试温、平均最低气温、及平均最高气温的观察资料。试求简单相关系数及二级偏相关系数。求简单相关系数及二级偏相关系数。普遍天数普遍天数平均气温平均气温平均最低气温平均最低气温平

9、均最高气温平均最高气温121229.029.024.224.234.634.6151527.827.823.623.632.632.6424219.219.214.914.925.225.2表8.3 腰果种子“普遍期”天数与气温表data cashew; input x1 x2 x3 x4 ; cards;12 29.0 24.2 34.6 .42 19.2 14.9 25.2;proc corr; var x1 x2 x3 x4;proc corr; var x3 x4; partial x2;proc corr; var x1 x4; partial x2 x3;run; Correlat

10、ion Analysis 2 PARTIAL Variables: X2 X3 2 VAR Variables: X1 X4Pearson Partial Correlation Coefficients / Prob |R| under Ho: Partial Rho=0 / N = 33 X1 X4 X1 1.00000 0.07517 0.0 0.6878 X4 0.07517 1.00000 0.6878 0.0统计结论统计结论: r34.2=-0.8031 p=0.00010.05 相关不显著相关不显著部分输出结果:部分输出结果: 组合代号组合代号 X1 X2 X3 YX1 X2 X

11、3 Y 1 10.37 29.56 33.31 10.520 1 10.37 29.56 33.31 10.520 2 10.47 34.25 29.05 10.070 2 10.47 34.25 29.05 10.070 3 9.67 35.25 37.65 12.790 3 9.67 35.25 37.65 12.790 4 9.87 29.25 31.52 9.230 4 9.87 29.25 31.52 9.230 5 8.20 37.85 33.62 10.360 5 8.20 37.85 33.62 10.360 6 8.67 37.78 38.09 12.570 6 8.67 3

12、7.78 38.09 12.570 7 10.03 40.97 30.42 12.560 7 10.03 40.97 30.42 12.560 8 9.00 46.00 29.10 11.388 8 9.00 46.00 29.10 11.388 9 10.07 39.73 32.06 12.830 9 10.07 39.73 32.06 12.830实习四实习四实实 习习作业作业:21个小麦双列杂交组合个小麦双列杂交组合F1的单株产量的单株产量y(克),每株穗(克),每株穗数数x1,每穗的粒数,每穗的粒数x2,千粒重千粒重x3(克)数据如下:(克)数据如下: 组合代号组合代号 X1 X2 X

13、3 YX1 X2 X3 Y 10 10.57 36.30 30.59 11.800 10 10.57 36.30 30.59 11.800 11 8.73 37.10 27.17 8.730 11 8.73 37.10 27.17 8.730 12 10.20 35.67 32.21 11.790 12 10.20 35.67 32.21 11.790 13 8.93 35.44 33.22 10.420 13 8.93 35.44 33.22 10.420 14 9.83 34.28 28.40 9.830 14 9.83 34.28 28.40 9.830 15 8.60 33.31 35

14、.49 10.920 15 8.60 33.31 35.49 10.920 16 8.83 35.10 27.54 8.440 16 8.83 35.10 27.54 8.440 17 8.80 34.45 34.20 10.500 17 8.80 34.45 34.20 10.500 18 8.80 30.65 29.47 7.940 18 8.80 30.65 29.47 7.940 19 9.40 31.20 30.75 8.830 19 9.40 31.20 30.75 8.830 20 10.03 39.27 29.21 11.330 20 10.03 39.27 29.21 11.

15、330试求试求ry1、ry3、ry1.2、 ry1.23 , 并确定其显著性。并确定其显著性。&8.3 直线回归分析直线回归分析(一元线性回归一元线性回归)一、直线回归方程一、直线回归方程正相关正相关r0 曲线相关曲线相关 负相关负相关rF0.05,显著,即,显著,即x与与y之间的直线回归关系显著。之间的直线回归关系显著。若若FF0.01,极显著。,极显著。若若FF0.05,不显著。,不显著。22剩余回归SSF 0:0H即两变量间不存在线性关系即两变量间不存在线性关系目的:了解样本所来自的集团中两变数间是否确实存目的:了解样本所来自的集团中两变数间是否确实存 在回归关系。在回归关系。二、回归的

16、显著性测验二、回归的显著性测验但必须注意,应用时但必须注意,应用时X的取值范围只能在拟合回归方的取值范围只能在拟合回归方程时所用样本的范围内,不能外推。程时所用样本的范围内,不能外推。显著时当bxay,可用于预测、控制等,可用于预测、控制等,1.1.预测:当预测:当X=xX=x0 0时,用回归方程预测值时,用回归方程预测值00bxay2)(1(200nQssxxnsxy其中:的置信区间:的条件总体均数1) 1 (/ xy , 00)2(0)2(0ynynStySty三、用直线方程预测三、用直线方程预测2)(11 (20nQssxxnsxy其中: , )2(0)2(0ynynStySty的置信区

17、间:预测值的1)2(P175例例8.3:橡胶树大型系比:橡胶树大型系比试验,刺检干胶量(试验,刺检干胶量(x:毫克)毫克)与正式割胶产量(与正式割胶产量(y:克)如克)如下下:编号编号刺检干胶量刺检干胶量 正式割胶产量正式割胶产量X y12.2677 8.864 7.9. . . .73 3.5 试求试求y关于关于x的回归方程,的回归方程,并对回归方程作显著性测验。并对回归方程作显著性测验。data latex; input x y ; cards;77 8.8 64 7.9 73 3.5; proc reg corr; model y=x/ cli clm;/*CLI输出输出Y值的值的95%

18、预测区间预测区间*/Plot y*x/conf95;run;其其SAS程序:程序:四、直线回归实例四、直线回归实例conf95在散点图(在散点图(x,y)上附加回归直线和均值置信区间)上附加回归直线和均值置信区间/*选项选项CORR,要求输出简单相关系数,要求输出简单相关系数*/clm输出条件总体平均数的输出条件总体平均数的95%置信区间置信区间SAS 系统系统The REG ProcedureCorrelationVariablexyx1.00000.7057y0.70571.0000SAS输出结果:输出结果:说明:说明:proc reg corr; 选项选项corr输出变量间的简单输出变量

19、间的简单相关系数相关系数 The REG ProcedureModel: MODEL1Dependent Variable: y Analysis of VarianceSourceDFSum ofSquaresMeanSquareF ValuePr FModel1137.80902137.8090223.81 |t|Intercept12.007461.530371.310.2020 x10.077090.015804.88.0001截距 截距截距a=2.00746,其标准误为,其标准误为1.53037。回归系数回归系数b=0.07709,其标准误为,其标准误为0.01580,t=4.88,

20、p FModel22852.83453 1426.4172615.37 0.0027Error7649.6094792.80135 Corrected Total93502.44400 Root MSE9.63335 R-Square0.8145Dependent Mean28.56000 Adj R-Sq0.7615Coeff Var33.73020 Parameter EstimatesVariableDFParameterEstimateStandardErrort ValuePr |t|Intercept1-135.0996261.37574-2.200.0636x1110.19568

21、4.316042.360.0502x211.283601.370170.940.38002128360. 119568.1009962.135xxy求二元回归方程求二元回归方程Output StatisticsObsDependentVariablePredictedValueStd ErrorMean Predict95% CL PredictResidual111.800021.67184.9777-3.968747.3123-9.8718100.5000-1.53626.7356-29.331426.25902.036211.31.09738.9945-0.067562.2621. 预测

22、出预测出1977年最终病情指数值年最终病情指数值95%的预测区间为的预测区间为-0.0675,62.26210973.31 y2:三元线性回归:三元线性回归P180P180例例8.4 8.4 甘蔗糖分与气象资料如表甘蔗糖分与气象资料如表8.58.5。试求。试求y y关于关于x x1 1,x x2 2,x x3 3的线性回归方程,并对方程作显著性测验。当的线性回归方程,并对方程作显著性测验。当方程达显著时,再对方程达显著时,再对19841984年糖分作预测。年糖分作预测。年份年份糖份糖份(y y)9 91212月份降月份降雨量(雨量(x x1 1)1010月份相对月份相对湿度(湿度(x x2 2

23、)1212月份最低月份最低温度(温度(x x3 3)64/6564/6513.9313.93408.6408.683834.34.365/6665/6613.8513.85460.9460.983833.03.066/6766/6714.2114.21151.8151.882824.74.783/8483/84390.0390.080804.64.6data sgca; input y x1-x3; cards;13.93 408.6 834.3 13.85 460.9 833.0 .11.59 480.4 831.5 . 390.0 804.6;proc reg;model y=x1-x3/

24、stb cli;run;SAS结果及解释结果及解释P147Analysis of VarianceSourceDFSum ofSquaresMeanSquareF Value Pr FModel37.79038 2.596799.08 0.0011Error154.29100 0.28607 Corrected Total18 12.08138 Parameter EstimatesVariableDFParameterEstimateStandardErrort ValuePr |t|StandardizedEstimateIntercept119.714623.189266.18 FMod

25、el14.288054.288059.350.0071Error177.793330.45843 Corrected Total1812.08138 VariableParameterEstimateStandardErrorType II SSF ValuePr FIntercept24.903503.5133123.0336750.24 FModel26.215533.107778.480.0031Error165.865850.36662 Corrected Total1812.08138 VariableParameterEstimateStandardErrorType II SSF

26、 ValuePr FIntercept22.951993.2550818.2275349.72 FModel37.790382.596799.080.0011Error154.291000.28607 Corrected Total1812.08138 VariableParameterEstimateStandardErrorType II SSF ValuePr FIntercept19.714623.1892610.9311238.21 FModel27.076633.5383111.310.0009Error165.004750.31280 Corrected Total1812.08

27、138 VariableParameterEstimateStandardErrorType II SSF ValuePr FIntercept14.727280.47031306.71958980.570 B20 B30 的图象 的图象 最简单的多项式是最简单的多项式是二次多项式二次多项式,其方程为:,其方程为:22102xbxbby2212xbxbayb20 B2F Model 1 29.00024 29.00024 0.998 0.3563 Error 6 174.33476 29.05579 C Total 7 203.33500 Root MSE 5.39034 R-square 0

28、.1426 Dep Mean 9.72500 Adj R-sq -0.0003 C.V. 55.42769 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T| INTERCEP 1 5.154762 4.95571021 1.040 0.3384 X 1 0.830952 0.83174792 0.999 0.3563Model: MODEL2 SourceDFSum ofSquaresMeanSquareF ValuePr FModel2198.604

29、0599.30202104.95 |t|Intercept130.273812.0784214.57.0001x1-10.221430.83905-12.18.0001x211.004760.0750513.39 FModel3201.4895067.16317145.570.0002Error41.845500.46137 Corrected Total7203.33500 Root MSE0.67925 R-Square0.9909Dependent Mean9.72500 Adj R-Sq0.9841Coeff Var6.98453 Parameter EstimatesVariable

30、DFParameterEstimateStandardErrort ValuePr |t|Intercept122.223813.531026.290.0033x1-4.541132.34574-1.940.1250 x21-0.145240.46283-0.310.7694x310.069700.027872.500.066720048. 12214.102738.30 xxy回归方程为:data new; input x y;cards;2 13.0 3 9.2 4 6.6 5 4.7 6 4.0 7 7.1 8 13.2 9 20.0;Proc GLM; MODEL Y=X X*X; R

31、UN;ParameterEstimateStandard Errort ValuePr |t|Intercept30.273809522.0784152814.57.0001x-10.221428570.83905350-12.18.0001x*x1.004761900.0750472313.39 |t| Intercept 130.6235863 3.14436916 41.54 |t|Intercept 128.7147914 2.54503370 50.57 .0001 rate -21.4326668 2.17191314 -9.87 |r| x1 x2 x1 1.00000 0.87879 0.0008x2 0.87879 1.00000 0.0008 Kendall Tau b 相关系数相关系数, N = 10当当 H0: Rho=0 时,时,Prob |r| x1 x2 x1 1.00000 0.73333 0.0032 x2 0.73333 1.00000 0.0032参数个数是观察值个数,不包括常数项回归项包括常数项其中修正pniiRpninR 01)1 (122。的自变数的个数越全面表示考虑影响时,越接近,决定系数y1R1R0R222

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁