《回归分析.ppt》由会员分享,可在线阅读,更多相关《回归分析.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、回归分析实验课程,(实验一)多元线性回归和变量的选择,2019/10/21,上海财经大学 统计与管理学院,2,目录,Excel部分SAS部分,Excel部分,2019/10/21,上海财经大学 统计与管理学院,4,Excel部分目录,1. Excel软件统计分析功能的加载2. 多元线性回归和变量的选择2.1 多元线性回归2.2 变量的选择,2019/10/21,上海财经大学 统计与管理学院,5,1. Excel软件统计分析功能的加载,在应用Excel软件进行回归分析之前,必须先加载一些工具库,加载成功后才能用Excel软件进行回归分析。具体方法:启动Excel软件进入系统界面用鼠标左键单击主菜
2、单中的“工具”,然后在下拉菜单中选择菜单项“加载宏” 。在弹出的“加载宏”对话框中选定“可用加载宏(A):”中的“分析工具库”和“分析工具库 VBA函数”两项。用鼠标左键单击此对话框中的“确定”按钮。,2019/10/21,上海财经大学 统计与管理学院,6,1. Excel软件统计分析功能的加载,2019/10/21,上海财经大学 统计与管理学院,7,1. Excel软件统计分析功能的加载,再打开主菜单中的“工具”菜单项的下拉菜单,将会看到有一“数据分析”菜单项,这说明Excel软件的统计分析功能已经加载成功。若没有“数据分析”这一菜单项,则说明Excel软件的统计分析功能没有加载成功。这样就
3、无法用Excel软件进行相应的统计分析。,2019/10/21,上海财经大学 统计与管理学院,8,2. 多元线性回归和变量的选择,2.1 多元线性回归 例2.1:某公司想研究一下管理人员所做的工作的情况。为此,公司作了管理人员素质的一份调查报告,包括职工是否满意他们的管理人员等有关问题。收集到的数据见表。,2019/10/21,上海财经大学 统计与管理学院,9,2. 多元线性回归和变量的选择,2019/10/21,上海财经大学 统计与管理学院,10,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,11,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管
4、理学院,12,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,13,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,14,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,15,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,16,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,17,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,18,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,19,2.1 多元线性回归,20
5、19/10/21,上海财经大学 统计与管理学院,20,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,21,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,22,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,23,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,24,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,25,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,26,2.2 变量的选择,2019/10/21,上海财经大学 统计与管理
6、学院,27,2.2 变量的选择,首先建立y关于x1x6的全变量线性回归方程,2019/10/21,上海财经大学 统计与管理学院,28,2.2 变量的选择,x4的系数p-值最大(0.765202 5%),删除x4 。再建立y关于x1,x2,x3,x5,x6的线性回归方程,2019/10/21,上海财经大学 统计与管理学院,29,2.2 变量的选择,x5的系数p-值最大(0.530165 5%),删除x5 。再建立y关于x1,x2,x3,x6的线性回归方程,2019/10/21,上海财经大学 统计与管理学院,30,2.2 变量的选择,x6的系数p-值最大(0.414502 5%),删除x6 。再建
7、立y关于x1,x2,x3的线性回归方程,2019/10/21,上海财经大学 统计与管理学院,31,2.2 变量的选择,x2的系数p-值最大(0.29991 5%),删除x2 。再建立y关于x1,x3的线性回归方程,SAS部分,2019/10/21,上海财经大学 统计与管理学院,33,SAS部分目录,1. SAS的菜单操作方法简介 1.1 SAS for Windows的启动 1.2 SAS for Windows系统窗口的组成及其功能 1.3 SAS for Windows的退出 1.4 SAS/ASSIST模块 1.5 SAS/ANALYST 2. 多元线性回归和变量的选择2.1 多元线性回
8、归2.2 变量的选择,2019/10/21,上海财经大学 统计与管理学院,34,1. SAS的菜单操作方法简介,SAS是一个功能非常强大的统计分析软件,本实验指导书只介绍其中一部分功能,注重介绍通过菜单操作完成所需实验的操作方法。 下面的操作均是在SAS8.2版本中实现的,其它版本的SAS软件的相应功能和操作方法可能会有所不同。,2019/10/21,上海财经大学 统计与管理学院,35,1.1 SAS for Windows的启动,2019/10/21,上海财经大学 统计与管理学院,36,1.2 SAS for Windows系统窗口的组成及其功能,2019/10/21,上海财经大学 统计与管
9、理学院,37,1.3 SAS for Windows的退出,方法1:鼠标左键单击SAS系统窗口右上角的关闭按钮。方法2:选择主菜单“File”“Exit”。方法3:鼠标左键双击SAS系统窗口左上角的SAS图标。,2019/10/21,上海财经大学 统计与管理学院,38,1.4 SAS/ASSIST模块,SAS/ASSIST模块是一个面向任务的菜单驱动模块,它通过提供菜单界面,使用户免去学SAS语言的负担通过选项可在让SAS系统在执行特定的功能过程中自动产生相应的SAS程序,可帮助学习或加快编写SAS程序。,2019/10/21,上海财经大学 统计与管理学院,39,1.4.1 进入SAS/ASS
10、IST,在命令框中键入ASSIST,再按Enter(回车)键,或按其左边的按钮选择主菜单Solutions ASSIST,2019/10/21,上海财经大学 统计与管理学院,40,1.4.1 进入SAS/ASSIST,选择“Cascading menus”,再按“Continue”按钮,则显示如图所示的按钮式菜单。,2019/10/21,上海财经大学 统计与管理学院,41,1.4.1 进入SAS/ASSIST,选择“Block menus”,再按“Continue”按钮,则显示如图S1.4.3所示的按钮式菜单。,2019/10/21,上海财经大学 统计与管理学院,42,1.4.1 进入SAS/
11、ASSIST,2019/10/21,上海财经大学 统计与管理学院,43,1.4.2 退出SAS/ASSIST,若是选择“Cascading menus”进入SAS/ASSIST模块的,则在主菜单窗口中按“Exit”按钮或单击主菜单窗口标题栏右上角的关闭按钮,即可退出SAS/ASSIST模块。若是选择“Block menus”进入SAS/ASSIST模块的,则在子菜单窗口中按“GOBACK”按钮直到返回主菜单窗口,然后按“Exit”按钮或单击主菜单窗口标题栏右上角的关闭按钮,即可退出SAS/ASSIST模块。,2019/10/21,上海财经大学 统计与管理学院,44,1.5 SAS/ANALYS
12、T,SAS/ ANALYST模块也是一个菜单驱动式数据分析模块。它通过项目文件来管理用户分析所需的各个元素,用菜单方式帮助用户逐步完成数据数据的加工和整理、作图以及统计分析,并最终制作和打印出分析报告。,2019/10/21,上海财经大学 统计与管理学院,45,1.5.1 进入SAS/ ANALYST,在命令框中键入ANALYST,再按Enter(回车)键,或按其左边的按钮选择主菜单Solutions Analysis Analyst,2019/10/21,上海财经大学 统计与管理学院,46,1.5.1 进入SAS/ ANALYST,2019/10/21,上海财经大学 统计与管理学院,47,退
13、出SAS/ ANALYST,进入SAS/ANALYST模块后,用鼠标左键单击ANALYST窗口右上角的关闭按钮。双击ANALYST窗口左上角的图标,将ANALYST窗口关闭即退出SAS/ANALYST模块。,2019/10/21,上海财经大学 统计与管理学院,48,2. 多元线性回归和变量的选择,本实验分成两部分:使用SAS进行多元线性回归使用SAS进行变量的选择,2019/10/21,上海财经大学 统计与管理学院,49,2.1 多元线性回归,本节以求数据集SASUSER.ADMIT中的体重(Weight)关于身高(Height)和年龄(Age)的二元线性回归方程为例,介绍用SAS/ASSIS
14、T模块进行多元线性回归分析的方法。,2019/10/21,上海财经大学 统计与管理学院,50,2.1 多元线性回归,通过SAS/ASSIST模块进入“SAS/ASSIST: Regression Analysis”表单。再单击表单中的“Table:”按钮,选定SASUSER.ADMIT数据集进行分析。 单击“SAS/ASSIST: Regression Analysis”表单中的“Independent:”按钮,进入“Select Table Variables”表单。分别双击“Available”窗口中的变量名“Age”和“Height”选定自变量 。,2019/10/21,上海财经大学 统
15、计与管理学院,51,按“Ok”按钮返回“SAS/ASSIST: Regression Analysis”表单 。,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,52,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,53,2.1 多元线性回归,选择主菜单“Run”“Submit”,稍候在输出窗口就显示出相应的分析结果,如下图所示。从中可见,回归方程是显著的,其p值小于0.0001。回归方程为Weight = 147.24144 + 4.18375Height + 0.48029Age.其中在5%显著性水平下,截距和Height的回归系数均显著
16、,而Age的回归系数不显著(其p值=0.10590.05)。,2019/10/21,上海财经大学 统计与管理学院,54,2.1 多元线性回归,2019/10/21,上海财经大学 统计与管理学院,55,2.2 变量的选择,本节介绍在SAS中使用逐步选择法(Stepwise selection)选择变量建立线性回归方程的方法。例S2.2.1:为了研究医院的工作量(y)与有关变量(x1, x2, x3, x4, x5)间的关系,收集了17个有关医院的数据,见表S2.2.1。 试用逐步回归方法建立y关于x1,x2,x3,x4,x5的线性回归方程。,2019/10/21,上海财经大学 统计与管理学院,5
17、6,2.2 变量的选择,2019/10/21,上海财经大学 统计与管理学院,57,2.2 变量的选择,进入模块SAS/ANALYST,新建一个项目文件,然后建立一个名为“Lm5_5”的数据集,在其中输入表S2.2.1中的数据,并在刚建的项目文件中打开此数据集“Lm5_5”,如下图所示。,2019/10/21,上海财经大学 统计与管理学院,58,2.2 变量的选择,选择主菜单“Statistics”“Regression”“Linear.”,进入“Linear Regression:Lm5_5”表单(如图)。单击左边窗口中的变量名“y”再按“Dependent”按钮,以选择因变量。选择变量“x1
18、, x2, x3, x4, x5”再按“Explanatory”按钮,以选定自变量(如图)。,2019/10/21,上海财经大学 统计与管理学院,59,2.2 变量的选择,按“Linear Regression:Lm5_5”表单中的“Model”按钮,进入“Linear Regression:Model”表单(如图)。单击其中的“Method”标签,进入“Choose a model selection method”画面,通过鼠标左键单击选择“Selection method”框中的“Stepwise selection”选项(如图)。,2019/10/21,上海财经大学 统计与管理学院,6
19、0,2.2 变量的选择,单击“Linear Regression:Model”表单中的“Criteria”标签,进入“Choose significance level criteria for Forward, Backward, and Stepwise methods”画面。在“Significance levels”框中可进行逐步回归中“选进变量”和“剔除变量”的显著性水平的设置(如图)。,2019/10/21,上海财经大学 统计与管理学院,61,2.2 变量的选择,单击“Linear Regression:Model”表单中的“Include”标签,进入“Select variabl
20、es to include in every model”画面,从中可设置总是需要包括在模型中的变量(如图)。,2019/10/21,上海财经大学 统计与管理学院,62,2.2 变量的选择,按“Linear Regression:Model”表单中的“Ok”按钮返回“Linear Regression:Lm5_5”表单,再按“Linear Regression:Lm5_5”表单中的“Ok”按钮,稍候即在“Analysis”结果输出窗口中显示出相应的计算结果(如图)。,2019/10/21,上海财经大学 统计与管理学院,63,2.2 变量的选择,如果要将“Analysis”窗口中的计算结果保存在
21、单独的文件中,则可在“Analysis”窗口为当前窗口的情况下选择主菜单“Edit”“Copy to Program Editor”,先将计算结果复制到程序编辑器中。再选择主菜单“File”“Save As.”将计算结果保存在文件中。,2019/10/21,上海财经大学 统计与管理学院,64,SAS逐步回归的输出,The REG Procedure Model: MODEL1 Dependent Variable: y y Stepwise Selection: Step 1 Variable x3 Entered: R-Square = 0.9683 and C(p) = 21.3596 A
22、nalysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 1 482796887 482796887 458.18 F Intercept -96.53368 341.90896 83997 0.08 0.7815 x3 1.11953 0.05230 482796887 458.18 F Model 2 489487894 244743947 375.91 F Intercept 2614.22073 887.26699 5651983 8.68 0.0106 x3 1.23884 0.05545 324920867 499.06 F 1 x3 x3 1 0.9683 0.9683 21.3596 458.18 .0001 2 x5 x5 2 0.0134 0.9817 8.8144 10.28 0.0063,