《第七讲多元线性回归精选PPT.ppt》由会员分享,可在线阅读,更多相关《第七讲多元线性回归精选PPT.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七讲多元线性回归第七讲多元线性回归第1页,本讲稿共76页统计应用统计应用预测大学足球比赛的获胜得分差额预测大学足球比赛的获胜得分差额 为为检检验验一一场场大大学学足足球球比比赛赛中中“争争球球码码数数”、“传传球球码码数数”、“回回传传次次数数”、“控控球球时时间间”以以及及“主主场场优优势势”等等变变量量对对比比赛赛最最后后得得分分的的影影响响,分分析析人人员员建建立立了了一一个个多多元元回回归归模模型型。该该模模型型的的因因变变量量是是“比比赛赛获获胜胜得得分分的的差差值值”,它它等等于于胜胜方方的的最最后后得得分分减减去去负负方方的的最后得分最后得分从从高高校校体体育育协协会会前前20
2、20名名球球队队的的比比赛赛中中随随机机抽抽取取了了9090场场,收收集集到到自自变变量量和和因因变变量量的的数数据据,并并进进行行多多元元回回归归分分析析,得得到到的的回回归归结结果果如如表表预测变量预测变量预测变量预测变量系数系数系数系数t t值值值值截距截距3.223.222.062.06争球码数差争球码数差0.110.1112.5012.50传球码数差传球码数差0.090.0910.1910.19回传次数差回传次数差-2.80-2.80-5.75-5.75控球时间差控球时间差-0.01-0.01-3.94-3.94主场优势变量主场优势变量3.043.041.681.68因变量:获胜得分
3、差因变量:获胜得分差修正的修正的R R2 2=0.72=0.72第2页,本讲稿共76页第第 7 讲讲 多元线性回归多元线性回归7.1 多元线性回归模型多元线性回归模型 7.2 回归方程的拟合优度回归方程的拟合优度7.3 显著性检验显著性检验7.4 多重共线性多重共线性7.5 利用回归方程进行估计和预测利用回归方程进行估计和预测7.6 变量选择与逐步回归变量选择与逐步回归7.7 虚拟自变量的回归虚拟自变量的回归7.8 非线性回归非线性回归第3页,本讲稿共76页学习目标学习目标1.回归模型、回归方程、估计的回归方程回归模型、回归方程、估计的回归方程2.回归方程的拟合优度回归方程的拟合优度3.回归方
4、程的显著性检验回归方程的显著性检验4.多重共线性问题及其处理多重共线性问题及其处理5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.虚拟自变量的回归问题虚拟自变量的回归问题7.非线性回归非线性回归8.用用 Excel 进行回归分析进行回归分析第4页,本讲稿共76页7.1 多元线性回归模型7.1.1 多元回归模型与回归方程多元回归模型与回归方程7.1.2 估计的多元回归方程估计的多元回归方程7.1.3 参数的最小二乘估计参数的最小二乘估计第5页,本讲稿共76页多元回归模型与回归方程多元回归模型与回归方程第6页,本讲稿共76页多元回归模型多元回归模型(multiple regressio
5、n model)1.1.一个因变量与两个及两个以上自变量的回归一个因变量与两个及两个以上自变量的回归2.2.描描述述因因变变量量 y y 如如何何依依赖赖于于自自变变量量 x x1 1 ,x x2 2 ,x xk k 和和误误差项差项 的方程,称为多元回归模型的方程,称为多元回归模型3.3.涉涉及及 k k 个自变量的多元回归模型可表示为个自变量的多元回归模型可表示为 0 0 ,1 1,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2 ,x xk k 的线性函数加上误差项的线性函数加上误差项 包包含含在在y y里里面面但但不不能能被
6、被k k个个自自变变量量的的线线性性关关系系 所解释的变异性所解释的变异性第7页,本讲稿共76页多元回归模型多元回归模型(基本假定基本假定)1.误差项是一个期望值为0的随机变量,即E()=02.对于自变量x1,x2,xk的所有值,的方差 2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立第8页,本讲稿共76页多元回归方程多元回归方程(multiple regression equation)1.描述因变量 y 的平均值或期望值如何依赖于自变量 x1,x2,xk的方程2.多元线性回归方程的形式为 E(y)=0+1 x1+2 x2+k xk 1 1,k k称为偏回归系数称为
7、偏回归系数 i i 表表示示假假定定其其他他变变量量不不变变,当当 x xi i 每每变变动动一一个个单位时,单位时,y y 的平均变动值的平均变动值第9页,本讲稿共76页二元回归方程的直观解释二元回归方程的直观解释二元线性回归模型二元线性回归模型二元线性回归模型二元线性回归模型(观察到的观察到的y y)回归面回归面 0 0 i ix x1 1y yx x2 2(x x1 1,x x2 2)第10页,本讲稿共76页估计的多元回归方程估计的多元回归方程第11页,本讲稿共76页估计的多元回的方程估计的多元回的方程(estimated multiple regression equation)(es
8、timated multiple regression equation)是是 估计值估计值 是是 y y 的估计值的估计值1.用样本统计量 估计回归方程中的 参数 时得到的方程2.由最小二乘法求得3.一般形式为第12页,本讲稿共76页参数的最小二乘估计参数的最小二乘估计第13页,本讲稿共76页参数的最小二乘法参数的最小二乘法2.2.求求解解各回归参数的标准方程如下各回归参数的标准方程如下1.1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达达到到最小来求得最小来求得 。即。即第14页,本讲稿共76页参数的最小二乘法参数的最小二乘法(例题分析例题分析)【例例
9、例例】一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的2525家家分分行行20022002年的有关业务数据。试建立不良贷款y与贷款余额x x1 1、累累计计应应收收贷贷款款x2 2、贷贷款款项项目目个个数数x x3和和固固定定资资产产投投资资额额x x4 4的的线线性回归方程,并解释各回归系数的含义性回归方程,并解释各回归系数的含义 用用Excel进行回归进行回归第15页,本讲稿共76页7.2 回归方程的拟合优度7.2.1 多重判定系数多重判定系数7.2.2 估计标准误差估计标准误差第16页,本讲稿共76页多重判定系数多重判定系数第17页,本讲稿共76页多重判
10、定系数多重判定系数(multiple coefficient of determination)1.回归平方和占总平方和的比例2.计算公式为3.因变量取值的变差中,能被估计的多元回归方程所解释的比例 第18页,本讲稿共76页修正多重判定系数修正多重判定系数(adjusted multiple coefficient of determinationadjusted multiple coefficient of determination)1.用样本量n n和自变量的个数和自变量的个数k k去修正去修正R R2 2得到 2.计算公式为计算公式为3.避免增加自变量而高估避免增加自变量而高估 R
11、R2 24.4.(消除了自变量个数及样本量个数的影响)(消除了自变量个数及样本量个数的影响)5.5.意义与意义与 R R2 2类似类似6.6.数值小于数值小于R2 2 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第19页,本讲稿共76页估计标准误差估计标准误差 Sy1.1.对误差项对误差项 的标准差的标准差 的的一个估计值一个估计值2.2.(指指用用自自变变量量x1,x2,x1,x2,预预测测因因变变量量y y时时的的平平均均预预测测误误差差)3.3.衡量多元回归方程的拟合优度衡量多元回归方程的拟合优度4.计算公式为计算公式为 Excel Excel 输出结
12、果的分析输出结果的分析输出结果的分析输出结果的分析第20页,本讲稿共76页7.3 显著性检验7.3.1 线性关系检验线性关系检验7.3.2 回归系数检验和推断回归系数检验和推断第21页,本讲稿共76页线性关系检验线性关系检验第22页,本讲稿共76页线性关系检验线性关系检验1.1.检检验验因因变变量量与与所有自自变变量量之之间间的的线线性性关关系系是是否否显显著著2.2.也被称为也被称为总体的显著性总体的显著性总体的显著性总体的显著性检验3.检检验验方方法法是是将将回回归归均均方方(MSRMSR)同残差均方(MSE)加加以以比比较较,应应应应用用用用 F F 检检检检验验验验来来分分析析二二者者
13、之之间间的的差差别别是是否否显著显著n n如果是显著的,因变量与自变量之间存在线性关系如果是显著的,因变量与自变量之间存在线性关系n n如如果果不不显显著著,因因变变量量与与自自变变量量之之间间不不存存在在线线性性关关系系第23页,本讲稿共76页线性关系检验线性关系检验1.1.提出提出假设假设n nH H0 0:1 1 2 2 k k=0 =0 线性关系不显著线性关系不显著n nH H1 1:1 1,2 2,k k至少有一个不等于至少有一个不等于0 02.2.计算计算检验统计量检验统计量F F3.3.确定确定显著性水平显著性水平 和分子自由度和分子自由度k k、分母自由度、分母自由度n-kn-
14、k-1 1找出临界值找出临界值F F 4.4.作出作出决策:若决策:若F F F F ,拒绝,拒绝H H0 0 Excel Excel 输输输输出结果的分析出结果的分析出结果的分析出结果的分析第24页,本讲稿共76页回归系数检验和推断回归系数检验和推断第25页,本讲稿共76页回归系数的检验回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第类错误(弃真错误)4.对每一个自变量都要单独进行检验5.应用 t 检验统计量第26页,本讲稿共76页回归系数的检验回
15、归系数的检验(步骤步骤)1.提出假设提出假设n nH H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.2.计算检验的统计量计算检验的统计量 t t3.3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t,拒绝,拒绝H H0 0;t t t t(25-2)=2.069(25-2)=2.069,所所以以均均拒绝原假设,说明这拒绝原假设,说明这4 4个自变量两两之间都有显著的相关关系个自变量两两之
16、间都有显著的相关关系2.2.由由 表表ExcelExcel输输 出出 的的 结结 果果 可可 知知,回回 归归 模模 型型 的的 线线 性性 关关 系系 显显 著著(Significance-F(Significance-F1.03539E-061.03539E-060.067030=0.05=0.05)。这也暗示了模型中存在多重共线性。这也暗示了模型中存在多重共线性3.3.固固定定资资产产投投资资额额的的回回归归系系数数为为负负号号(-0.029193)(-0.029193),与与预预期期的的不一致不一致第36页,本讲稿共76页多重共线性问题的处理多重共线性问题的处理第37页,本讲稿共76页
17、多重共线性多重共线性(问题的处理问题的处理)1.将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关2.如果要在模型中保留所有的自变量,则应n n避免根据避免根据 t t 统计量对单个参数进行检验统计量对单个参数进行检验n n对对因因变变量量值值的的推推断断(估估计计或或预预测测)限限定定在在自自变变量样本值的范围内量样本值的范围内 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第38页,本讲稿共76页提示提示1.在建立多元线性回归模型时,不要试图引入更多的自变量,除非确实有必要2.在社会科学的研究中,由于所使用的大多数数据都是非试验性质的,因此,
18、在某些情况下,得到的结果往往并不令人满意,但这不一定是选择的模型不合适,而是数据的质量不好,或者是由于引入的自变量不合适 第39页,本讲稿共76页7 7.5 利用回归方程进行估计和预测软件应用第40页,本讲稿共76页置信区间估计置信区间估计(例题分析例题分析)STATISTICASTATISTICA输出的不良贷款的输出的不良贷款的输出的不良贷款的输出的不良贷款的置信区间置信区间置信区间置信区间第41页,本讲稿共76页预测区间估计预测区间估计(例题分析例题分析)STATISTICASTATISTICA输出的不良贷款的输出的不良贷款的输出的不良贷款的输出的不良贷款的预测区间预测区间预测区间预测区间
19、第42页,本讲稿共76页7.6 变量选择与逐步回归7.6.1 变量选择过程变量选择过程7.6.2 向前选择向前选择7.6.3 向后剔除向后剔除7.6.4 逐步回归逐步回归第43页,本讲稿共76页变量选择过程变量选择过程1.1.在建立回归模型时,对自变量进行筛选在建立回归模型时,对自变量进行筛选2.2.选择自变量的原则是对统计量进行显著性检验选择自变量的原则是对统计量进行显著性检验n n将将一一个个或或一一个个以以上上的的自自变变量量引引入入到到回回归归模模型型中中时时,是是否否使使得得残残差差平平方方和和(SSESSE)有有显显著著减减少少。如如果果增增加加一一个个自自变变量量使使SSESSE
20、的的减减少少是是显显著著的的,则则说说明明有有必必要要将将这这个个自自变变量量引引入入回回归归模模型型,否否则则,就就没没有有必必要要将这个自变量引入回归模型将这个自变量引入回归模型n n确确定定引引入入自自变变量量是是否否使使SSESSE有有显显著著减减少少的的方方法法,就就是是使使用用F F统统计计量量的的值值作作为为一一个个标标准准,以以此此来来确确定定是是在在模模型型中中增增加加一一个个自自变变量量,还还是是从从模模型中剔除一个自变量型中剔除一个自变量3.3.变变量量选选择择的的方方法法主主要要有有:向向前前选选择择、向向后后剔剔除除、逐逐步步回回归、最优子集等归、最优子集等 第44页
21、,本讲稿共76页向前选择向前选择 (forward selection)1.从模型中没有自变量开始2.对k个自变量分别拟合对因变量的一元线性回归模型,共有k个,然后找出F统计量的值最高的模型及其自变量,并将其首先引入模型 3.分别拟合引入模型外的k-1个自变量的线性回归模型 4.如此反复进行,直至模型外的自变量均无统计显著性为止第45页,本讲稿共76页向后剔除向后剔除 (backward elimination)1.1.先对因变量拟合包括所有先对因变量拟合包括所有k k个自变量的回归模型。然个自变量的回归模型。然后考察后考察p p(p p k k)个去掉一个自变量的模型个去掉一个自变量的模型(
22、这些模型中每这些模型中每一个都有一个都有k k-1-1个自变量个自变量),使模型的,使模型的SSESSE值减小最少的自值减小最少的自变量被挑选出来并从模型中剔除变量被挑选出来并从模型中剔除2.2.考察考察p p个再去掉一个自变量的模型个再去掉一个自变量的模型(这些模型中每一个都这些模型中每一个都有有k k-2-2个的自变量个的自变量),使模型的,使模型的SSESSE值减小最少的自变量值减小最少的自变量被挑选出来并从模型中剔除被挑选出来并从模型中剔除3.3.如此反复进行,一直将自变量从模型中剔除,直至剔除一如此反复进行,一直将自变量从模型中剔除,直至剔除一个自变量不会使个自变量不会使SSESSE
23、显著减小为止显著减小为止第46页,本讲稿共76页逐步回归逐步回归 (stepwise regression)1.1.将向前选择和向后剔除两种方法结合起来筛选自变量将向前选择和向后剔除两种方法结合起来筛选自变量2.2.在在增增加加了了一一个个自自变变量量后后,它它会会对对模模型型中中所所有有的的变变量量进进行行考考察察,看看看看有有没没有有可可能能剔剔除除某某个个自自变变量量。如如果果在在增增加加了了一一个个自自变变量量后后,前前面面增增加加的的某某个个自自变变量量对对模模型型的的贡贡献献变变得得不不显显著著,这这个个变量就会被剔除变量就会被剔除3.3.按按照照以以上上方方法法不不停停地地增增加
24、加变变量量并并考考虑虑剔剔除除以以前前增增加加的的变变量量的的可能性,直至增加变量已经不能导致可能性,直至增加变量已经不能导致SSESSE显著减少显著减少4.4.在在前前面面步步骤骤中中增增加加的的自自变变量量在在后后面面的的步步骤骤中中有有可可能能被被剔剔除除,而而在在前前面面步步骤骤中中剔剔除除的的自自变变量量在在后后面面的的步步骤骤中中也也可可能能重重新新进进入入到到模型中模型中第47页,本讲稿共76页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)Variable Entered/Removed Variable Entered/Removed a a model mod
25、el Variable EnteredVariable EnteredVariable Variable RemovedRemovedmethodmethod1 1各项贷款余额各项贷款余额各项贷款余额各项贷款余额x1 x1 Stepwise(Criteria:Probability-of-Stepwise(Criteria:Probability-of-F-to-enter=.050,F-to-enter=.050,Probability-of-F-to-remove=.100.Probability-of-F-to-remove=.100.2 2固定资产投资额固定资产投资额固定资产投资额固定
26、资产投资额x4 x4 Stepwise(Criteria:Probability-of-Stepwise(Criteria:Probability-of-F-to-enter=.050,F-to-enter=.050,Probability-of-F-to-remove=.100.Probability-of-F-to-remove=.100.a Dependent variable:a Dependent variable:不良贷款不良贷款y y第48页,本讲稿共76页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)Model summaryModel summary mode
27、l model R RR-SquareR-SquareAdjusted R-Adjusted R-SquareSquare Std.Error of the Std.Error of the EstimateEstimate 1 1.844.844a a.712.712.699.6991.97991.97992 2.872.872b b.761.761.739.7391.84281.8428a Predictors:(Constant),a Predictors:(Constant),各项贷款余额各项贷款余额x1x1b Predictors:(Constant),b Predictors:(C
28、onstant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4第49页,本讲稿共76页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ANOVA ANOVA c c modelmodelmodelmodelSum of SquaresSum of SquaresSum of SquaresSum of SquaresdfdfdfdfMean SquareMean SquareMean SquareMean SquareF F F FSig.Sig.Sig.Sig.1 Regress1 Regress1 Regress1 Regress Residual
29、 Residual Residual ResidualTotalTotalTotalTotal222.486222.486222.486222.48690.16490.16490.16490.164312.650312.650312.650312.6501 1 1 12323232324242424222.486222.486222.486222.4863.9203.9203.9203.92056.75456.75456.75456.754.000.000.000.000a a a a2 Regress2 Regress2 Regress2 Regress Residual Residual
30、Residual Residual Total Total Total Total237.941237.941237.941237.94174.70974.70974.70974.709312.650312.650312.650312.6502 2 2 22222222224242424118.971118.971118.971118.9713.3963.3963.3963.39635.03435.03435.03435.034.000.000.000.000b b b ba Predictors:(Constant),a Predictors:(Constant),各项贷款余额各项贷款余额x
31、1x1b Predictors:(Constant),b Predictors:(Constant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4c Dependent variable:c Dependent variable:不良贷款不良贷款y y第50页,本讲稿共76页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ModelModelUnstandardizedUnstandardizedCoefficientsCoefficientsUnstandardizedUnstandardizedCoefficientsCoefficientst t
32、Sig.Sig.B BStd.ErrorStd.ErrorBetaBeta1 (Constant)1 (Constant)贷贷款余款余额额x1 x1 -.830-.830.038.038.723.723.005.00508440844-1.147-1.1477.5347.534.263.263.000.0002 (Constant)2 (Constant)贷贷款余款余额额x1x1 固定固定资产资产投投资资x4x4-.443-.443.050.050-.032-.032.697.697.007.007.015.0151.1201.120-.355-.355-.636-.6366.7326.732
33、-2.133-2.133.531.531.000.000.044.044a Dependent variable:a Dependent variable:不良贷款不良贷款y yCoefficients a第51页,本讲稿共76页7.7 虚拟自变量的回归7.7.1 含有一个虚拟自变量的回归含有一个虚拟自变量的回归7.7.2 用虚拟自变量回归解决方差分析问题用虚拟自变量回归解决方差分析问题第52页,本讲稿共76页含有一个虚拟自变量的回归含有一个虚拟自变量的回归第53页,本讲稿共76页虚拟自变量虚拟自变量(dummy variable)1.用数字代码表示的定性自变量2.虚拟自变量可有不同的水平虚拟
34、自变量可有不同的水平n n只有两个水平的虚拟自变量只有两个水平的虚拟自变量l l比如,性别比如,性别(男,女男,女)n n有两个以上水平的虚拟自变量有两个以上水平的虚拟自变量l l贷款企业的类型贷款企业的类型(家电,医药,其他家电,医药,其他)3.虚拟变量的取值为虚拟变量的取值为0,1 1第54页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归1.1.回归模型中使用虚拟自变量时,称为虚拟自变量的回归回归模型中使用虚拟自变量时,称为虚拟自变量的回归2.2.当当虚虚拟拟自自变变量量只只有有两两个个水水平平时时,可可在在回回归归中中引引入入一个虚拟变量一个虚拟变量n n比如,性别比如,性别(男,女男
35、,女)3.3.一一般般而而言言,如如果果定定性性自自变变量量有有k k个个水水平平,需需要要在在回回归归模型中引进模型中引进k k-1-1个虚拟变量个虚拟变量第55页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)【例例例例】为为了了研研究究考考试试成成绩绩与与性性别别之之间间的的关关系系,从从某某大大学学商商学学院院随随机机抽抽取取男男女女学学生生各各8 8名名,得得到到他他们们的的市市场场营营销销学学课课程程的的考考试试成成绩绩如如右右表表 第56页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归(考试成绩与性别的散点图考试成绩与性别的散点图)男 女第57页,本讲稿共7
36、6页虚拟自变量的回归虚拟自变量的回归(成绩与性别的成绩与性别的成绩与性别的成绩与性别的Mean/SD/1.96*SDMean/SD/1.96*SD箱线图箱线图箱线图箱线图)y y与与与与x x的回归的回归的回归的回归第58页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)引进虚拟变量时,回归方程表示为引进虚拟变量时,回归方程表示为E E(y y)=)=0 0+1 1x x 男男(x x=0)=0):E E(y y)=)=0 0男学生考试成绩的期望值男学生考试成绩的期望值 女女(x x=1)=1):E E(y y)=)=0 0+1 1 1 1女学生考试成绩的期望值女学生考试成
37、绩的期望值 注意:当指定虚拟变量注意:当指定虚拟变量0 0,1 1时时 0 0总总是是代代表表与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水水平平的平均值的平均值 1 1总总是是代代表表与与虚虚拟拟变变量量值值1 1所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均响响应应与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水水平平的的平平均值的差值,即均值的差值,即 平均值的差值平均值的差值 =(=(0 0+1 1)-)-0 0=1 1第59页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)【例例例例】为为研研究究工工
38、资资水水平平与与工工作作年年限限和和性性别别之之间间的的关关系系,在在某某行行业业中中随随机机抽抽取取1010名名职职工工,所所得得数数据据如右表如右表 y y与与与与x x1 1的回归及分析的回归及分析的回归及分析的回归及分析 y y与与与与x x1 1,x x2 2的回归及分析的回归及分析的回归及分析的回归及分析第60页,本讲稿共76页虚拟自变量的回归虚拟自变量的回归 (例题分析例题分析)引进虚拟变量时,回归方程写为引进虚拟变量时,回归方程写为 E E(y y)=)=0 0+1 1x x1 1+2 2x x2 2 女女(x x2 2=0)=0):E E(y y|女性女性)=)=0 0+1
39、1x x1 1 男男(x x2 2=1)=1):E E(y y|男性男性)=()=(0 0+2 2)+)+1 1x x1 1 0 0表示:女性职工的期望月工资收入表示:女性职工的期望月工资收入 (0 0+2 2)表示:男性职工的期望月工资收入表示:男性职工的期望月工资收入 1 1表示:工作年限每增加表示:工作年限每增加1 1年,男性或女性工资的平均增加值年,男性或女性工资的平均增加值 2 2表表示示:男男性性职职工工的的期期望望月月工工资资收收入入与与女女性性职职工工的的期期望望月工资收入之间的差值月工资收入之间的差值 (0 0+2 2)-)-0 0=2 2第61页,本讲稿共76页用虚拟自变量
40、回归用虚拟自变量回归解决方差分析问题解决方差分析问题第62页,本讲稿共76页方差分析的回归方法方差分析的回归方法 (例题分析例题分析)引进虚拟变量引进虚拟变量 建立回归方程:建立回归方程:E E(Y Y)=)=0 0+1 1x x1 1+2 2x x2 2+3 3x x3 3 用用用用ExcelExcel进行回归进行回归进行回归进行回归 0 0家电制造业投诉次数的平均值家电制造业投诉次数的平均值 (0 0+1 1)零售业投诉次数的平均值零售业投诉次数的平均值 (0 0+2 2)旅游业投诉次数的平均值旅游业投诉次数的平均值 (0 0+3 3)航空公司投诉次数的平均值航空公司投诉次数的平均值 第6
41、3页,本讲稿共76页7.8 非线性回归7.8.1 双曲线双曲线7.8.2 幂函数曲线幂函数曲线7.8.3 对数曲线对数曲线第64页,本讲稿共76页非线性回归非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型第65页,本讲稿共76页双曲线双曲线 0 0 01.基本形式:基本形式:2.2.线性化方法线性化方法令:令:y y =1/=1/y y,x x=1/=1/x x,则有则有y y =+x x 3.3.图像图像第66页,本讲稿共76页幂函数曲线幂函数曲线1.1.基本形式:基本形式:2.线性化
42、方法化方法n n两端取对数得:两端取对数得:lg lg y y=lg=lg +lglg x xn n令:令:y y =lg=lgy y,x x=lg=lg x x,则则y y =lglg +x x 3.图像00 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 第67页,本讲稿共76页对数曲线对数曲线1.1.基本形式:基本形式:2.2.线性化方法线性化方法x x=ln=lnx x,则有则有y y =+x x 3.3.图像图像 0 0 0 0 第68页,本讲稿共76页指数曲线指数曲线1.1.基本形式:基本形式:2.线性化方法两端取对数得:两端取对数得:lnlny y =ln=ln
43、 +x x令:令:y y =ln=lny y,则有,则有y y =lnln +x x3.图像图像 第69页,本讲稿共76页S 型曲线型曲线1.基本形式:基本形式:2.2.线性化方法线性化方法n n令:令:y y =1/=1/y y,x x=e=e-x x,则有则有y y =+x x3.3.图像图像第70页,本讲稿共76页非线性回归非线性回归(例题分析例题分析)【例例例例】一一种种商商品品的的需需求求量量与与其其价价格格有有一一定定的的关关系系。现现对对一一定定时时期期内内的的商商品品价价格格x x与与需需求求量量y y进进行行观观察察,取取得得的的样样本本数数据据如如下下表表。试试判判断断商商
44、品品价价格格与与需需求求量量之之间间回回归归函函数数的的类类型型,并求需求量对价格的回归方程并求需求量对价格的回归方程废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系价格价格价格价格 (元元元元)x x1 12 23 34 45 56 67 78 89 91010需求量需求量需求量需求量(kg)(kg)y y5858505044443838343430302929262625252424第71页,本讲稿共76页非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图价格与需求量的散点图价格与需求量的散点图第72页,本讲稿共76页非线性回
45、归非线性回归 (例题分析例题分析)1.用双曲线模型:2.按线性回归的方法求解和,得第73页,本讲稿共76页非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图价格与需求量的散点图价格与需求量的散点图第74页,本讲稿共76页本章小结本章小结1.1.多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程2.2.回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度3.3.显著性检验显著性检验显著性检验显著性检验4.4.多重共线性多重共线性多重共线性多重共线性5.5.利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测6.6.虚拟自变量虚拟自变量虚拟自变量虚拟自变量的回归的回归的回归的回归7.7.非线性非线性非线性非线性回归回归回归回归8.8.方方方方差分析的回归方法差分析的回归方法差分析的回归方法差分析的回归方法第75页,本讲稿共76页结结 束束第76页,本讲稿共76页