《应用回归分析实验报告4.doc》由会员分享,可在线阅读,更多相关《应用回归分析实验报告4.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、实 验 报 告实验课程 应用回归分析 第 4 次实验 实验日期2012.10.25 指导教师 王振羽 班级 基地班 学号 1007402072 姓名 张艺璇 成绩 一、实验目的1、进一步熟悉SPSS的常用统计功能.2、掌握建立多元回归方程的方法与步骤二、实验内容在训练中氧气消耗能力问题的研究中,我们想要建立一个关系式,以便根据训练测试的数据来预报肺活量,而不必进行昂贵和笨重的氧气消耗测试。考察的因变量y为OXY(氧气消耗能力),自变量有x1(age,年龄)、x2(weight,体重)、x3(RunTime,1.5英里跑的时间)、x4(RstPulse, 休息时脉博)、x5(RunPulse,跑
2、步时脉博)、x6(RunPulse, 跑步时最大脉博)。(数据在回归人大数据12-学生.xls的 “练习第2题”中 ),利用统计软件(1) 写出y , x1, x2, x3, x4, x5, x6的相关系数矩阵(2) 写出y关于 x1, x2, x3, x4, x5, x6的线性回归方程(3) 对回归方程作检验(要有方差分析表)(4) 对每一个回归系数作显著性检验:(5) 逐个剔除不显著的变量, 建立新的回归方程(6) 给出新的回归方程中每一个回归系数的置信水平为95%的置信区间;(7) 写出原回归方程和新回归方程的标准化回归方程(8) x0 = (50, 90, 14, 70, 180, 1
3、90) 时, 写出y0的预测值 ,y0的预测概率为0.90的精确预测区间以及Ey0的置信水平为90%的置信区间。三、实验结果与分析(包括运行结果及其数据分析、解释等)运用SPSS分析数据,结果如下:(1) 写出y , x1, x2, x3, x4, x5, x6的相关系数矩阵相关性yx1x2x3x4x5x6Pearson 相关性y1.000-.305-.163-.862-.399-.398-.237x1-.3051.000-.234.189-.164-.338-.433x2-.163-.2341.000.144.044.182.249x3-.862.189.1441.000.450.314.2
4、26x4-.399-.164.044.4501.000.352.305x5-.398-.338.182.314.3521.000.930x6-.237-.433.249.226.305.9301.000Sig. (单侧)y.048.191.000.013.013.100x1.048.103.155.189.032.007x2.191.103.221.407.164.088x3.000.155.221.006.043.111x4.013.189.407.006.026.048x5.013.032.164.043.026.000x6.100.007.088.111.048.000.Ny313131
5、31313131x131313131313131x231313131313131x331313131313131x431313131313131x531313131313131x631313131313131故(2) 写出y关于 x1, x2, x3, x4, x5, x6的线性回归方程系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)102.93412.4038.299.000x1-.227.100-.222-2.273.032.6611.513x2-.074.055-.116-1.359.187.8661.155x3-2.629.385-.685-6
6、.835.000.6291.591x4-.022.066-.031-.326.747.7061.416x5-.370.120-.711-3.084.005.1198.437x6.303.136.5222.221.036.1148.744a. 因变量: y由上表得,回归方程为:模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.921a.849.8112.316948.84922.433624.000a. 预测变量: (常量), x6, x3, x2, x4, x1, x5。Anovab模型平方和df均方FSig.1回归722.54461
7、20.42422.433.000a残差128.838245.368总计851.38230a. 预测变量: (常量), x6, x3, x2, x4, x1, x5。b. 因变量: y(3) 对回归方程作检验(要有方差分析表)由以上两表知,复相关系数R=0.921,决定系数=0.849,F=22.433,p值=0.000,则回归方程高度显著,说明,整体上对y有高度显著的线性影响。(4) 对每一个回归系数作显著性检验:输出结果如下表:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)102.93412.4038.299.000x1-.227.100-.222-2.273.032x
8、2-.074.055-.116-1.359.187x3-2.629.385-.685-6.835.000x4-.022.066-.031-.326.747x5-.370.120-.711-3.084.005x6.303.136.5222.221.036a. 因变量: y由上表得,自变量,对y均有显著影响,其中的P值最大,但仍在5的显著水平上对y高度显著;自变量,对y无显著性影响,其中的P值较小,但仍大于0.05,即在5的显著水平上对y不显著。(5) 逐个剔除不显著的变量, 建立新的回归方程先剔除x6,得到以下数据:其中,x2的P值为0.187,大于0.05.再剔除x2,得到以下数据:其中,x6
9、的P值为0.053,大于0.05.再剔除x6,得到以下数据:由上表数据得,新的回归方程为:(6) 给出新的回归方程中每一个回归系数的置信水平为95%的置信区间;由以上数据得到,(7) 写出原回归方程和新回归方程的标准化回归方程原回归方程的标准化回归方程为:新回归方程的标准化回归方程为:(8) x0 = (50, 90, 14, 70, 180, 190) 时, 写出y0的预测值 ,y0的预测概率为0.90的精确预测区间以及Ey0的置信水平为90%的置信区间。根据以上数据得到:写出y0的预测值y0的预测概率为0.90的精确预测区间为: 31.15669,40.40188;Ey0的置信水平为90%的置信区间为:33.75768,37.80089;