数据分析24学习教案.pptx

上传人:一*** 文档编号:71938870 上传时间:2023-02-07 格式:PPTX 页数:41 大小:434.04KB
返回 下载 相关 举报
数据分析24学习教案.pptx_第1页
第1页 / 共41页
数据分析24学习教案.pptx_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《数据分析24学习教案.pptx》由会员分享,可在线阅读,更多相关《数据分析24学习教案.pptx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据分析数据分析24第一页,共41页。2 22.1 线性回归模型及基参数估计2.2 统计推断与预测2.3 残差分析(fnx)2.4 回归方程的选取第1页/共41页第二页,共41页。3 32.4 回归方程的选取(xunq)1.1.理解理解理解理解(lji)(lji)回归方程中自变量选取的必要性;回归方程中自变量选取的必要性;回归方程中自变量选取的必要性;回归方程中自变量选取的必要性;2.2.掌握穷举法回归方程选取法掌握穷举法回归方程选取法掌握穷举法回归方程选取法掌握穷举法回归方程选取法3.3.掌握逐步回归法回归方程选取法掌握逐步回归法回归方程选取法掌握逐步回归法回归方程选取法掌握逐步回归法回归方

2、程选取法4.4.了解利用了解利用了解利用了解利用SASSAS的的的的Proc regProc reg过程选取回归方程过程选取回归方程过程选取回归方程过程选取回归方程的方法的方法的方法的方法 第2页/共41页第三页,共41页。4 42.4回归方程的选取(xunq)n n回归方程的选取分为:回归方程的选取分为:回归方程的选取分为:回归方程的选取分为:n n 1.1.回归方程类型回归方程类型回归方程类型回归方程类型(线性与非线性线性与非线性线性与非线性线性与非线性)的选取的选取的选取的选取n n 2.2.回归方程类型确定回归方程类型确定回归方程类型确定回归方程类型确定(qudng)(qudng)后自

3、变量的选取后自变量的选取后自变量的选取后自变量的选取n n 用全部可能的自变量建立的回归方程并不一用全部可能的自变量建立的回归方程并不一用全部可能的自变量建立的回归方程并不一用全部可能的自变量建立的回归方程并不一n n定是最好的:定是最好的:定是最好的:定是最好的:n n 一方面是将一些对因变量影响很小甚至根本无一方面是将一些对因变量影响很小甚至根本无一方面是将一些对因变量影响很小甚至根本无一方面是将一些对因变量影响很小甚至根本无影响的自变量包含在方程里,增加计算量,导致参影响的自变量包含在方程里,增加计算量,导致参影响的自变量包含在方程里,增加计算量,导致参影响的自变量包含在方程里,增加计算

4、量,导致参数估计与预测值的精度下降数估计与预测值的精度下降数估计与预测值的精度下降数估计与预测值的精度下降n n 另一方面是自变量太多不利于应用回归方程对另一方面是自变量太多不利于应用回归方程对另一方面是自变量太多不利于应用回归方程对另一方面是自变量太多不利于应用回归方程对实际问题作出合理的解释,也会造成数据的收集和实际问题作出合理的解释,也会造成数据的收集和实际问题作出合理的解释,也会造成数据的收集和实际问题作出合理的解释,也会造成数据的收集和模型应用的费用不必要的加大模型应用的费用不必要的加大模型应用的费用不必要的加大模型应用的费用不必要的加大 第3页/共41页第四页,共41页。例例8.2

5、.2 8.2.2 设单因素有三水平,每个水平下实验设单因素有三水平,每个水平下实验(shyn)(shyn)的次数不同。的次数不同。因素因素 I II III I II III 0.365 0.27 0.305 0.365 0.27 0.305 0.255 0.275 0.250 0.255 0.275 0.250 0.195 0.240 0.225 0.195 0.240 0.225 0.215 0.265 0.215 0.265 0.185 0.185问三水平下的结果是否有显著区别?注意问三水平下的结果是否有显著区别?注意 groupgroup的使用。的使用。data=0.365 0.255

6、 0.195 0.215 0.27 0.275 0.24 data=0.365 0.255 0.195 0.215 0.27 0.275 0.24 0.265.0.185 0.305 0.25 0.225;0.265.0.185 0.305 0.25 0.225;group=1,1,1,1,2,2,2,2,.group=1,1,1,1,2,2,2,2,.2,3,3,3;2,3,3,3;p=anova1(data,group)p=anova1(data,group)第4页/共41页第五页,共41页。p=0.9338方差分析表为:方差分析表为:结果表明,没有结果表明,没有(mi yu)显著性差别。

7、即该因素对实验没有显著性差别。即该因素对实验没有(mi yu)影响。影响。第5页/共41页第六页,共41页。7 7n n在实际应用在实际应用在实际应用在实际应用(yngyng)(yngyng)中,如何从与因变量有中,如何从与因变量有中,如何从与因变量有中,如何从与因变量有关的自变量集合中选取一个关的自变量集合中选取一个关的自变量集合中选取一个关的自变量集合中选取一个“最优最优最优最优”的自变量的自变量的自变量的自变量子集,以建立一个既合理又简单的回归方程是子集,以建立一个既合理又简单的回归方程是子集,以建立一个既合理又简单的回归方程是子集,以建立一个既合理又简单的回归方程是十分重要的。十分重要

8、的。十分重要的。十分重要的。n n主要介绍两种常用的回归方程选取方法:主要介绍两种常用的回归方程选取方法:主要介绍两种常用的回归方程选取方法:主要介绍两种常用的回归方程选取方法:n n1.1.从所有可能的自变量子集中选取从所有可能的自变量子集中选取从所有可能的自变量子集中选取从所有可能的自变量子集中选取“最优最优最优最优”回回回回归方程:即穷举法归方程:即穷举法归方程:即穷举法归方程:即穷举法n n2.2.逐步回归法逐步回归法逐步回归法逐步回归法第6页/共41页第七页,共41页。8 82.4.1 2.4.1 穷举法穷举法n n设与因变量设与因变量设与因变量设与因变量Y Y有关有关有关有关(yu

9、gun)(yugun)的的的的“所有可能所有可能所有可能所有可能”的变量的变量的变量的变量X X的的的的 个数为个数为个数为个数为M-1M-1,记为,记为,记为,记为X1,X2,XM-1.X1,X2,XM-1.n n穷举法:从这穷举法:从这穷举法:从这穷举法:从这M-1M-1个自变量的所有可能的子集个自变量的所有可能的子集个自变量的所有可能的子集个自变量的所有可能的子集(z j)(z j)所拟合的回归方程中,按照一定准则选所拟合的回归方程中,按照一定准则选所拟合的回归方程中,按照一定准则选所拟合的回归方程中,按照一定准则选取最优的一个或几个。取最优的一个或几个。取最优的一个或几个。取最优的一个

10、或几个。n n对任一给定的对任一给定的对任一给定的对任一给定的1pM,1pM,拟合包含拟合包含拟合包含拟合包含p-1p-1个自变量的个自变量的个自变量的个自变量的所有回归方程共有所有回归方程共有所有回归方程共有所有回归方程共有 个,对有个,对有个,对有个,对有M-1M-1个自变个自变个自变个自变量,共需要拟合量,共需要拟合量,共需要拟合量,共需要拟合 个回归方程。个回归方程。个回归方程。个回归方程。n n必须必须必须必须(bx)(bx)建立一定准则选取最优的:优良性的建立一定准则选取最优的:优良性的建立一定准则选取最优的:优良性的建立一定准则选取最优的:优良性的准则准则准则准则 第7页/共41

11、页第八页,共41页。9含有含有含有含有(hn yu)p-1(hn yu)p-1(hn yu)p-1(hn yu)p-1个自变量的回归方程其复相个自变量的回归方程其复相个自变量的回归方程其复相个自变量的回归方程其复相关系数:关系数:关系数:关系数:SSEpSSEp为相应为相应为相应为相应(xingyng)(xingyng)回归方程的残差平方和;回归方程的残差平方和;回归方程的残差平方和;回归方程的残差平方和;SSTSST为总离差平方和且与回归方程无关;为总离差平方和且与回归方程无关;为总离差平方和且与回归方程无关;为总离差平方和且与回归方程无关;1 1 修正的复相关系数准则或均方残差准则修正的复

12、相关系数准则或均方残差准则修正的复相关系数准则或均方残差准则修正的复相关系数准则或均方残差准则 (或或或或 准则准则准则准则)是评价回归方程的重要指标:值越大,是评价回归方程的重要指标:值越大,是评价回归方程的重要指标:值越大,是评价回归方程的重要指标:值越大,方程的拟合效果越好,即观测数据与理论方程的拟合效果越好,即观测数据与理论方程的拟合效果越好,即观测数据与理论方程的拟合效果越好,即观测数据与理论模型的预测值的偏离程度就越小模型的预测值的偏离程度就越小模型的预测值的偏离程度就越小模型的预测值的偏离程度就越小第8页/共41页第九页,共41页。10当当当当p p p p增大时,增大时,增大时

13、,增大时,SSESSESSESSEp p p p减小,而减小,而减小,而减小,而 在增大,在增大,在增大,在增大,因而用直接利用因而用直接利用因而用直接利用因而用直接利用 达到最大没有实际意义达到最大没有实际意义达到最大没有实际意义达到最大没有实际意义?将将将将p p p p的控制作用引入到的控制作用引入到的控制作用引入到的控制作用引入到 中得修正的复相关系数中得修正的复相关系数中得修正的复相关系数中得修正的复相关系数P P P P增加时,增加时,增加时,增加时,MSEp=SSEp/(n-p)MSEp=SSEp/(n-p)MSEp=SSEp/(n-p)MSEp=SSEp/(n-p)分子与分母都

14、减小,分子与分母都减小,分子与分母都减小,分子与分母都减小,不再是不再是不再是不再是p p p p的单调函数的单调函数的单调函数的单调函数.SST/(n-1).SST/(n-1).SST/(n-1).SST/(n-1)不随不随不随不随p p p p变化,变化,变化,变化,因而存在因而存在因而存在因而存在p p p p使使使使MSEp=MSEp=MSEp=MSEp=达到最小,即存在达到最小,即存在达到最小,即存在达到最小,即存在p p p p使复相关使复相关使复相关使复相关(xinggun)(xinggun)(xinggun)(xinggun)系数达到最大系数达到最大系数达到最大系数达到最大第9

15、页/共41页第十页,共41页。11实用实用实用实用(shyng)(shyng)中中中中,利用观测数据拟合所有可能的利用观测数据拟合所有可能的利用观测数据拟合所有可能的利用观测数据拟合所有可能的2M-1-12M-1-1个个个个回归方程,从中选取使回归方程,从中选取使回归方程,从中选取使回归方程,从中选取使R2a(p)R2a(p)达到最大或接近最达到最大或接近最达到最大或接近最达到最大或接近最大或使大或使大或使大或使MSEpMSEp达到最小或接近最小且包含较少自变达到最小或接近最小且包含较少自变达到最小或接近最小且包含较少自变达到最小或接近最小且包含较少自变量的回归方程作为最优回归方程量的回归方程

16、作为最优回归方程量的回归方程作为最优回归方程量的回归方程作为最优回归方程以以以以 达到最大或达到最大或达到最大或达到最大或MSEMSEMSEMSEp p p p达到最小作为回归方达到最小作为回归方达到最小作为回归方达到最小作为回归方程程程程的评选准则称为的评选准则称为的评选准则称为的评选准则称为修正的复相关系数准则或均方修正的复相关系数准则或均方修正的复相关系数准则或均方修正的复相关系数准则或均方残差准则残差准则残差准则残差准则第10页/共41页第十一页,共41页。12122.Cp2.Cp准则准则准则准则(zhnz)(zhnz)C Cp p准则准则准则准则统计量为统计量为统计量为统计量为其中其

17、中其中其中SSEpSSEp残差平方和;残差平方和;残差平方和;残差平方和;MSEMSE为利用全部为利用全部为利用全部为利用全部M-1M-1变量变量变量变量(binling)(binling)拟合线性回归方程的均方残拟合线性回归方程的均方残拟合线性回归方程的均方残拟合线性回归方程的均方残差差差差.理论结果理论结果理论结果理论结果(ji gu):(ji gu):当利用观测数据对当利用观测数据对当利用观测数据对当利用观测数据对p-1p-1个个个个变量与变量与变量与变量与M-1M-1变量拟合的回归方程无显著差异时,有变量拟合的回归方程无显著差异时,有变量拟合的回归方程无显著差异时,有变量拟合的回归方程

18、无显著差异时,有E(E(C Cp p)(n-p)-(n-2p)=p E()(n-p)-(n-2p)=p E(C CMM)=M)=M拟合较好的方程,其拟合较好的方程,其拟合较好的方程,其拟合较好的方程,其C Cp p值应值应值应值应p p相差不大,故相差不大,故相差不大,故相差不大,故C Cp p准则准则准则准则选取使选取使选取使选取使C Cp p准准准准最接近最接近最接近最接近p p的回归方程为的回归方程为的回归方程为的回归方程为最优最优最优最优第11页/共41页第十二页,共41页。1313实用实用实用实用(shyng)(shyng)中中中中,当自变量数当自变量数当自变量数当自变量数M-M-1

19、 1较大时,较大时,较大时,较大时,拟合所有拟合所有拟合所有拟合所有2M-1-12M-1-1个回归方程,将个回归方程,将个回归方程,将个回归方程,将相应的相应的相应的相应的(p,Cp)(p,Cp)描在如右的图中,描在如右的图中,描在如右的图中,描在如右的图中,再作参考直线再作参考直线再作参考直线再作参考直线Cp=p,Cp=p,称之为称之为称之为称之为CpCp图图图图在在在在CpCp图中最接近参考直线图中最接近参考直线图中最接近参考直线图中最接近参考直线Cp=pCp=p的点所对应的回归方程为的点所对应的回归方程为的点所对应的回归方程为的点所对应的回归方程为最优方程最优方程最优方程最优方程第12页

20、/共41页第十三页,共41页。14143 预测预测(yc)平方和准则平方和准则(PRESSp准则准则)预测平方和准则的思想:对给定的预测平方和准则的思想:对给定的p-1个自个自变变量量X1,X2,Xp-1的的n组观测组观测(gunc)数据数据删第删第i组数据组数据,利用其余利用其余利用其余利用其余n-1n-1组拟合因变量组拟合因变量组拟合因变量组拟合因变量Y Y与与与与X X1 1,X,X2 2,X,Xp-1p-1的线性回归模型,并对的线性回归模型,并对yi作预测作预测记其预测值为记其预测值为则预测误差为则预测误差为对任意对任意(rny)i=1,2,n,求得求得n个预测误差个预测误差d1(p)

21、,d2(p),dn(p)。第13页/共41页第十四页,共41页。15若相应回归模型的对观测数据拟合较好,则若相应回归模型的对观测数据拟合较好,则应较小。应较小。预测平方和准则即拟合所有可能预测平方和准则即拟合所有可能(knng)的的回归方程回归方程并计算相应的并计算相应的PRESSp值,选取使值,选取使PRESSp达到达到最小或接近最小的回归方程为最优回归方程最小或接近最小的回归方程为最优回归方程 PRESSpPRESSp值值由由定定义义要要拟拟合合n n次次模模型型(mxng)(mxng),但但可可证证明明 为用全部为用全部n组观测值拟合相应模型的残差,组观测值拟合相应模型的残差,为相应的杠

22、杆量为相应的杠杆量第14页/共41页第十五页,共41页。16 对指定的对指定的对指定的对指定的p-1p-1个自变量,只需拟合一次回归个自变量,只需拟合一次回归个自变量,只需拟合一次回归个自变量,只需拟合一次回归(hugu)(hugu)模型模型模型模型即可求得即可求得即可求得即可求得PRESSpPRESSp值为值为值为值为 SAS SAS系统中系统中系统中系统中,可利用可利用可利用可利用(lyng)proc reg(lyng)proc reg提供了提供了提供了提供了R2a(p)R2a(p)准则准则准则准则与与与与CpCp准则选取最优回归方程的选项,准则选取最优回归方程的选项,准则选取最优回归方程

23、的选项,准则选取最优回归方程的选项,PRESSpPRESSp准准准准则可按要求对每个可能的回归方程输出则可按要求对每个可能的回归方程输出则可按要求对每个可能的回归方程输出则可按要求对每个可能的回归方程输出 最后最后最后最后(zuhu)(zuhu)算出算出算出算出PRESSpPRESSp第15页/共41页第十六页,共41页。1717例例例例2.9 2.9 2.9 2.9 对例对例对例对例2.8,2.8,2.8,2.8,病人生存时间病人生存时间病人生存时间病人生存时间(shjin)(shjin)(shjin)(shjin)的的的的Box-CoxBox-CoxBox-CoxBox-Cox变变变变换变

24、量换变量换变量换变量Z Z Z Z与与与与X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4的线性回归模型是合理,试分别的线性回归模型是合理,试分别的线性回归模型是合理,试分别的线性回归模型是合理,试分别用以上用以上用以上用以上3 3 3 3准则来选择最优回归方程准则来选择最优回归方程准则来选择最优回归方程准则来选择最优回归方程 解:由例解:由例解:由例解:由例2.82.82.82.8可知可知可知可知Y Y Y Y与与与与X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4的线性回归的线性回归的线性回归的线性回归(hug

25、u)(hugu)(hugu)(hugu)模模模模型是不合理的,须要进行型是不合理的,须要进行型是不合理的,须要进行型是不合理的,须要进行Box-CoxBox-CoxBox-CoxBox-Cox变换:变换:变换:变换:此时新变量此时新变量此时新变量此时新变量(binling)Z(binling)Z(binling)Z(binling)Z与与与与X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4X1,X2,X3,X4的线性的线性的线性的线性回归模型是回归模型是回归模型是回归模型是合理的。下面分别就三个准则进行讨论合理的。下面分别就三个准则进行讨论合理的。下面分别就三个准则进行讨论合

26、理的。下面分别就三个准则进行讨论第16页/共41页第十七页,共41页。18181.R2a(p)1.R2a(p)准则准则准则准则(zhnz)(zhnz)data examp2_9;/*data examp2_9;/*建立数据建立数据建立数据建立数据(shj)(shj)集集集集*/*/input x1-x4 y;input x1-x4 y;cards;cards;数据数据数据数据(shj)(shj)略!略!略!略!data a;/*data a;/*做做做做Box-CoxBox-Cox变换变换变换变换*/*/set examp2_9;set examp2_9;yy=(y*0.07-1)/0.07;

27、yy=(y*0.07-1)/0.07;run;run;/*/*利用利用利用利用regreg的选择项计算所有的选择项计算所有的选择项计算所有的选择项计算所有24-1=1524-1=15的的的的个线性回归方程的个线性回归方程的个线性回归方程的个线性回归方程的R2a(p)*/R2a(p)*/proc reg data=a;proc reg data=a;model yy=x1-x4/selection=adjrsq;model yy=x1-x4/selection=adjrsq;run;run;第17页/共41页第十八页,共41页。1919 Adjusted R-Square Selection M

28、ethodNumber in Adjusted Model R-Square R-Square Variables in Model 3 0.9719 0.9735 x1 x2 x3 4 0.9714 0.9736 x1 x2 x3 x4 3 0.8777 0.8846 x2 x3 x4 2 0.8032 0.8106 x2 x3 3 0.7062 0.7229 x1 x3 x4 2 0.6781 0.6903 x3 x4 1 0.4281 0.4388 x3 2 0.4202 0.4421 x1 x2 1 0.3403 0.3528 x2 1 0.1065 0.1233 x1根据根据R2a(

29、p)R2a(p)准则可知准则可知,因变量因变量Y Y与与x1 x2 x3x1 x2 x3的线性的线性回归方程的修正回归方程的修正(xizhng)(xizhng)的复相关系数达到最的复相关系数达到最大,为最优大,为最优第18页/共41页第十九页,共41页。20202.Cp2.Cp准则准则准则准则(zhnz)(zhnz)data examp2_9;/*data examp2_9;/*建立数据集建立数据集建立数据集建立数据集*/*/input x1-x4 y;input x1-x4 y;cards;cards;数据略!数据略!数据略!数据略!data a;/*data a;/*做做做做Box-Cox

30、Box-Cox变换变换变换变换(binhun)*/(binhun)*/set examp2_9;set examp2_9;yy=(y*0.07-1)/0.07;yy=(y*0.07-1)/0.07;run;run;/*/*利用利用利用利用regreg的选择项计算所有的选择项计算所有的选择项计算所有的选择项计算所有24-1=1524-1=15的的的的个线性回归方程的个线性回归方程的个线性回归方程的个线性回归方程的Cp*/Cp*/proc reg data=a;proc reg data=a;model yy=x1-x4/selection=cp;model yy=x1-x4/selection=

31、cp;run;run;第19页/共41页第二十页,共41页。2121 C(p)Selection MethodNumber in Model C(p)R-Square Variables in Model 3 3.2253 0.9735 x1 x2 x3 4 5.0000 0.9736 x1 x2 x3 x4 3 168.1581 0.8846 x2 x3 x4 2 303.5455 0.8106 x2 x3 3 468.4716 0.7229 x1 x3 x4 2 526.9253 0.6903 x3 x4 2 588.8785 0.6569 x2 x4 根据根据Cp(p)Cp(p)准则准则

32、(zhnz)(zhnz)可知可知,因变量因变量Y Y与与x1 x2 x3x1 x2 x3的线的线性性回归方程为最优回归方程回归方程为最优回归方程第20页/共41页第二十一页,共41页。22223.PRESSp3.PRESSp准则准则准则准则(zhnz)(zhnz)/*/*利用利用利用利用regreg中的关键字中的关键字中的关键字中的关键字presspress计算每个回计算每个回计算每个回计算每个回归归归归(hugu)(hugu)模型的模型的模型的模型的di(p)*/di(p)*/proc reg data=a;proc reg data=a;model yy=x1/noprint;model

33、yy=x1/noprint;output out=aa1 press=press;output out=aa1 press=press;run;run;/*/*利用利用利用利用meansmeans的的的的ussuss计算相应模型的计算相应模型的计算相应模型的计算相应模型的PRESSpPRESSp值值值值*/*/proc means uss data=aa1;proc means uss data=aa1;var press;var press;run;run;第21页/共41页第二十二页,共41页。2323本例本例本例本例3 3种准则下种准则下种准则下种准则下,都选同一都选同一都选同一都选同一

34、“回模回模回模回模”.”.拟合结果拟合结果拟合结果拟合结果(ji(ji gu)gu)如下如下如下如下 Parameter StandardVariable DF Estimate Error t Value Pr|t|Intercept 1 0.41273 0.13807 2.99 0.0043 x1 1 0.23145 0.01321 17.52 .0001 x2 1 0.03077 0.00124 24.84 .0001 x3 1 0.03141 0.00099242 31.65 Model 3 42.30779 14.10260 611.84 Fx1 1.000000 0.1233 7.

35、31 0.0092x2 1.000000 0.3528 28.34 .0001x3 1.000000 0.4388 40.67 .0001x4 1.000000 0.5355 59.94 FIntercept 4.42093 0.23525 137.11090 353.16 .0001x4 0.61908 0.07996 23.27156 59.94 .0001因为因为x4的偏的偏F值最大且值最大且P Fx1 0.747578 0.5358 0.04 0.8425x2 0.863820 0.6569 18.05 .0001x3 0.826591 0.6903 25.49 FIntercept

36、3.41749 0.27770 39.97099 151.45 .0001x3 0.01844 0.00365 6.72845 25.49 .0001x4 0.46661 0.07252 10.92777 41.40 .0001因为因为x3的偏的偏F值最大且值最大且P Fx1 0.591788 0.7229 5.88 0.0190 x2 0.825800 0.8846 84.23 FIntercept 1.94826 0.23437 6.92949 69.10 .0001x2 0.02599 0.00283 8.44634 84.23 .0001x3 0.02287 0.00230 9.896

37、80 98.69 .0001x4 0.27850 0.04917 3.21654 32.08 .0001因为因为x2的偏的偏F值最大且值最大且P Fx1 0.555861 0.9736 165.16 FIntercept 0.45246 0.16239 0.18175 7.76 0.0076x1 0.22600 0.01759 3.86671 165.16.0001x2 0.03046 0.00141 10.89770 465.47.0001x3 0.03103 0.00128 13.74166 586.95.0001x4 0.01490 0.03139 0.00527 0.23 0.6372

38、因为因为x1的偏的偏F值最大且值最大且P FIntercept 0.41273 0.13807 0.20596 8.94 0.0043x1 0.23145 0.01321 7.07797 307.08 .0001x2 0.03077 0.00124 14.22155 617.00 .0001x3 0.03141 0.00099242 23.09540 1002.0001重新拟合含重新拟合含x1x2x3的模型后,其中的模型后,其中x1的偏的偏F统计统计量值最小,其量值最小,其p值值0.050.05,故,故X4X4不进入模型,选择过程结束不进入模型,选择过程结束(jish)(jish),得到最优回

39、归,得到最优回归方程方程Variable Tolerance R-Square F Value Pr F x4 0.391339 0.9736 0.23 0.6372第39页/共41页第四十页,共41页。4141小结(xioji)n n首先首先首先首先,选择合适选择合适选择合适选择合适(hsh)(hsh)的因变量、自变量、的因变量、自变量、的因变量、自变量、的因变量、自变量、个数个数个数个数,n n数据量数据量数据量数据量n n是是是是p-1p-1的的的的6 6倍或倍或倍或倍或1010倍,剔错保真倍,剔错保真倍,剔错保真倍,剔错保真;n n其次其次其次其次,大致判断大致判断大致判断大致判断“线

40、回线回线回线回”模型的可行性模型的可行性模型的可行性模型的可行性,先建一先建一先建一先建一个自变量的个自变量的个自变量的个自变量的“线回线回线回线回”模型模型模型模型,检验模型的合理性检验模型的合理性检验模型的合理性检验模型的合理性(是是是是否线回否线回否线回否线回,正态正态正态正态,同方差同方差同方差同方差),),有无必要引入高次项有无必要引入高次项有无必要引入高次项有无必要引入高次项,交交交交叉叉叉叉(jioch)(jioch)项等项等项等项等,有无必要变换因变量等有无必要变换因变量等有无必要变换因变量等有无必要变换因变量等;n n最后最后最后最后,选择有显著影响的自变量选择有显著影响的自变量选择有显著影响的自变量选择有显著影响的自变量,确定几个最确定几个最确定几个最确定几个最优的模型优的模型优的模型优的模型,再比出合适的模型再比出合适的模型再比出合适的模型再比出合适的模型.第40页/共41页第四十一页,共41页。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁