《线性回归分析实验报告.docx》由会员分享,可在线阅读,更多相关《线性回归分析实验报告.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、试验一:线性回归分析试验目的:通过本次试验把握回归分析的根本思想和根本方法,理解最小二乘法的计算步骤,理解模型的设定 T 检验,并能够依据检验结果对模型的合理性进展推断,进而改进模型。理解残差分析的意义和重要性,会对模型的回归残差进展正态型和独立性检验,从而能够推断模型是否符合回归分析的根本假设。试验内容:用线性回归分析建立以高血压作为被解释变量,其他变量作为解释变量的线性回归模型。分析高血压与其他变量之间的关系。试验步骤:1、选择 File | Open | Data 命令,翻开 gaoxueya.sav图 1-1 数据集gaoxueya 的局部数据2、 选择Analyze | Regres
2、sion | Linear命令,弹出 Linear Regression (线性回归) 对话框,如图 1-2 所示。将左侧的血压y选入右侧上方的Dependent(因变量) 框中,作为被解释变量。再分别把年龄x1、体重x2、吸烟指数x3选入 Independent 自变量框中,作为解释变量。在Method方法下拉菜单中,指定自变量进入分析的方法。图 1-2 线性回归分析对话框3、单击 Statistics 按钮,弹出 Linear Regression : Statistics线性回归分析:统计量对话框,如图 1-3 所示。1-3 线性回归分析统计量对话框4、单击 Continue 回到线性回
3、归分析对话框。单击 Plots ,翻开 Linear Regression:Plots线性回归分析:图形对话框,如图1-4 所示。完成如下操作。图 1-4 线性回归分析:图形对话框5、单击Continue ,回到线性回归分析对话框,单击Save 按钮,翻开Linear Regression; Save 对话框,如图 1-5 所示。完成如图操作。图 1-5 线性回归分析:保存对话框6、单击 Continue ,回到线性回归分析对话框,单击 Options 按钮,翻开 Linear Regression; Options 对话框,如图 1-6 所示。完成如下操作。图 1-6 线性回归分析选项对话框
4、7、单击Continue ,回到线性回归分析对话框,然后单击OK,进入计算分析。试验结论:图 1-7 给出了根本的描述性统计量,图中显示各个变量的全部观测量的Mean均值、Std.Deviation标准差和观测量总数 N。图 1-8 给出了相关系数矩阵表,其中显示 4 个自变量两两间的Pearson 相关系数,以及相关关系等于 0 的假设的单位显著性检验概率。Correlations血压吸烟年龄体重指数Descriptive StatisticsMeanStd.DeviationN血压1.4444E214.3030332吸烟.5312.5070132年龄53.43756.8905632体重指数
5、3.53484.78275532图1-7描述性统计量表Pearson Correlatio n血压1.000.243.818.659吸烟.2431.000-.115.069年龄.818-.1151.000.621体重指数.659.069.6211.000血压.090.000.000吸烟.090.266.354年龄.000.266.000体重指数.000.354.000.血压32323232吸烟32323232年龄32323232体重指数32323232Sig.(1-tailed)N图1-8相关系数矩阵从表中看到因变量血压与自变量年龄、体重系数的相关系数依次为 0.818、0.659,反应高血压
6、与年龄、体重系数具有显著的相关关系。说明年龄和体重系数对人是否患高血压有显著影响。相比而言,吸烟这个自变量与因变量血压之间的相关系数较小,仅为0.243,说明他们之间的线性关系不显著。说明吸烟对人是否患高血压不具显著影响。此外年龄与体重系数相关系数为 0.621,说明年龄与体重系数之间存在显著性相关关系。Variables Entered/RemovedbModelVariablesEnteredVariablesRemovedMethod1体重指数, 吸烟,年龄a. Entera. All requested variables entered.b. Dependent Variable:
7、血压图 7-9 给出了进入模型和被剔除的变量的信息,从表中我们可以看出,3 个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。图1-9变量进入|剔除信息表图 1-10 给出了模型整体拟合效果的概述,模型的拟合度系数为 0.895,反映了因变量与自变量之间具有高度显著的关系。Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.895a.801.7806.706361.213a. Predictors: (Constant), 体重指数, 吸烟, 年龄b. Depe
8、ndent Variable: 血压图1-10 模型概述表图 1-11 给出了方差分析表,我们可以看到模型的设定检验F 统计量的值为 37.669,显著性水平的P 值几乎为 0,于是我们的模型通过了设定检验,也就是说,因变量与自变量之间的显著性关系明显。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression5082.56631694.18937.669.000aResidual1259.3092844.975Total6341.87531a. Predictors: (Constant), 体重指数, 吸烟, 年龄b. Dependent
9、Variable: 血压图1-11 方差分析表图1-12给出了回归系数表和变量显著性的T值,我们觉察,全部变量的T值都到达显著性水平。ModelBStd. ErrorBetatSig.1(Constant)45.7249.7464.692.000吸烟8.9222.431.3163.670.001年龄1.547.228.7456.798.000体重指数3.1951.995.1751.601.120CoefficientsaUnstandardized CoefficientsStandardizedCoefficientsa. Dependent Variable: 血压图1-12 回归系数表R
10、esiduals Statisticsa图1-13给出了残差分析表,表中显示推测值、残差、标准化推测值、标准化最小值、最 大值、均值、标准差及样本容量等。标准化残差确实定值最大为2.044,小于3,说明样本中无奇异值。MinimumMaximumMeanStd. DeviationNPredicted Value119.5472168.48351.4444E212.8044432Std. Predicted Value-1.9441.878.0001.00032Standard Error of Predicted1.6485.9922.245.77532ValueAdjusted Predi
11、cted Value118.7923175.43561.4456E213.3179032Residual-9.5766413.71040.000006.3736132Std. Residual-1.4282.044.000.95032Stud. Residual-1.4742.206-.0031.01232Deleted Residual-1.02023E115.96993-.118407.3454532Stud. Deleted Residual-1.5072.384.0071.03832Mahal. Distance.90323.7772.9063.98232Cook”s Distance
12、.000.395.043.07832Centered Leverage Value.029.767.094.12832a. Dependent Variable: 血压图1-13残差统计表图1-14和1-15给出了模型残差的直方图和正态概率P-P图。图1-14 残差分布直方图图1-15 正态概率P-P图从正态概率P-P图,图中的散点大致散布于斜线四周,因此可以认为残差分布根本上是正态的。从之前的分析结果来看,我们的模型需要剔除变量x2,用本次试验同样的方法对y、x1、x3进展回归,得到结果如图1-16、1-17、1-18所示。Model SummarybModelRR SquareAdjust
13、ed RSquareStd. Error of theEstimateDurbin-Watson1.840a.706.6868.019251.198a. Predictors: (Constant), 体重指数, 年龄b. Dependent Variable: 血压图1-16 模型概述ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression4476.93122238.46534.808.000aResidual1864.9442964.308Total6341.87531a. Predictors: (Constant), 体重指数, 年龄b. Dependent Variable: 血压图1-17方差分析表ModelBStd. ErrorBetatSig.1(Constant)54.79811.2734.861.000年龄1.379.267.6645.173.000体重指数4.5132.347.2471.923.064CoefficientsaUnstandardized CoefficientsStandardizedCoefficientsa. Dependent Variable: 血压4-18 方差分析表