《第七讲多元线性回归精选文档.ppt》由会员分享,可在线阅读,更多相关《第七讲多元线性回归精选文档.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七讲多元线性回归第七讲多元线性回归本讲稿第一页,共七十六页统计应用统计应用预测大学足球比赛的获胜得分差额预测大学足球比赛的获胜得分差额 为为检检验验一一场场大大学学足足球球比比赛赛中中“争争球球码码数数”、“传传球球码码数数”、“回回传传次次数数”、“控控球球时时间间”以以及及“主主场场优优势势”等等变变量量对对比比赛赛最最后后得得分分的的影影响响,分分析析人人员员建建立立了了一一个个多多元元回回归归模模型型。该该模模型型的的因因变变量量是是“比比赛赛获获胜胜得得分分的的差差值值”,它它等等于于胜胜方方的的最最后得分减去负方的最后得分后得分减去负方的最后得分从从高高校校体体育育协协会会前前2
2、020名名球球队队的的比比赛赛中中随随机机抽抽取取了了9090场场,收收集集到到自自变变量量和和因因变变量量的的数数据据,并并进进行行多多元元回回归归分分析析,得得到到的的回回归归结果如表结果如表预测变量预测变量预测变量预测变量系数系数系数系数t t值值值值截距截距3.223.222.062.06争球码数差争球码数差0.110.1112.5012.50传球码数差传球码数差0.090.0910.1910.19回传次数差回传次数差-2.80-2.80-5.75-5.75控球时间差控球时间差-0.01-0.01-3.94-3.94主场优势变量主场优势变量3.043.041.681.68因变量:获胜得
3、分差因变量:获胜得分差修正的修正的R R2 2=0.72=0.72本讲稿第二页,共七十六页第第 7 讲讲 多元线性回归多元线性回归7.1 多元线性回归模型多元线性回归模型 7.2 回归方程的拟合优度回归方程的拟合优度7.3 显著性检验显著性检验7.4 多重共线性多重共线性7.5 利用回归方程进行估计和预测利用回归方程进行估计和预测7.6 变量选择与逐步回归变量选择与逐步回归7.7 虚拟自变量的回归虚拟自变量的回归7.8 非线性回归非线性回归本讲稿第三页,共七十六页学习目标学习目标1.回归模型、回归方程、估计的回归方程回归模型、回归方程、估计的回归方程2.回归方程的拟合优度回归方程的拟合优度3.
4、回归方程的显著性检验回归方程的显著性检验4.多重共线性问题及其处理多重共线性问题及其处理5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.虚拟自变量的回归问题虚拟自变量的回归问题7.非线性回归非线性回归8.用用 Excel 进行回归分析进行回归分析本讲稿第四页,共七十六页7.1 多元线性回归模型多元线性回归模型7.1.1 多元回归模型与回归方程多元回归模型与回归方程7.1.2 估计的多元回归方程估计的多元回归方程7.1.3 参数的最小二乘估计参数的最小二乘估计本讲稿第五页,共七十六页多元回归模型与回归方程多元回归模型与回归方程本讲稿第六页,共七十六页多元回归模型多元回归模型(mult
5、iple regression model)1.一个因变量与两个及两个以上自变量的回归2.2.描描述述因因变量 y 如如何何依依赖赖于于自自变变量量 x1 1,x x2 2,xk k 和误差项 的方程,称为多元回归模型的方程,称为多元回归模型3.涉及及 k 个自变量的多元回归模型可表示为 0 0 ,1 1,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2 ,x xk k 的线性函数加上误差项的线性函数加上误差项 包包含含在在y y里里面面但但不不能能被被k k个个自自变变量量的的线线性性关关系系 所所解释的变异性解释的变异性本讲稿第
6、七页,共七十六页多元回归模型多元回归模型(基本假定基本假定)1.误差项是一个期望值为0的随机变量,即E()=02.对于自变量x1,x2,xk的所有值,的方差 2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立本讲稿第八页,共七十六页多元回归方程多元回归方程(multiple regression equation)1.描述因变量 y 的平均值或期望值如何依赖于自变量 x1,x2,xk的方程2.多元线性回归方程的形式为 E(y)=0+1 x1+2 x2+k xk 1 1,k k称为偏回归系数称为偏回归系数 i i 表表示示假假定定其其他他变变量量不不变变,当当 x xi
7、i 每每变变动动一一个个单单位时,位时,y y 的平均变动值的平均变动值本讲稿第九页,共七十六页二元回归方程的直观解释二元回归方程的直观解释二元线性回归模型二元线性回归模型二元线性回归模型二元线性回归模型(观察到的观察到的y y)回归面回归面 0 0 i ix x1 1y yx x2 2(x x1 1,x x2 2)本讲稿第十页,共七十六页估计的多元回归方程估计的多元回归方程本讲稿第十一页,共七十六页估计的多元回的方程估计的多元回的方程(estimated multiple regression equation)(estimated multiple regression equation)
8、是是 估计值估计值 是是 y y 的估计值的估计值1.用样本统计量 估计回归方程中的 参数 时得到的方程2.由最小二乘法求得3.一般形式为本讲稿第十二页,共七十六页参数的最小二乘估计参数的最小二乘估计本讲稿第十三页,共七十六页参数的最小二乘法参数的最小二乘法2.求解各回归参数的标准方程如下各回归参数的标准方程如下1.1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达达到到最最小来求得小来求得 。即。即本讲稿第十四页,共七十六页参数的最小二乘法参数的最小二乘法(例题分析例题分析)【例例】一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银
9、行所属的25家分行2002年的有关业务数据。试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义 用用Excel进行回归进行回归本讲稿第十五页,共七十六页7.2 回归方程的拟合优度回归方程的拟合优度7.2.1 多重判定系数多重判定系数7.2.2 估计标准误差估计标准误差本讲稿第十六页,共七十六页多重判定系数多重判定系数本讲稿第十七页,共七十六页多重判定系数多重判定系数(multiple coefficient of determination)1.回归平方和占总平方和的比例2.计算公式为3.因变量取值的变差中,能被估计的多
10、元回归方程所解释的比例 本讲稿第十八页,共七十六页修正多重判定系数修正多重判定系数(adjusted multiple coefficient of determinationadjusted multiple coefficient of determination)1.用样本量n和自变量的个数k去修正R2得到 2.计算公式为3.避免增加自变量而高估 R24.(消除了自变量个数及样本量个数的影响)5.意义与 R2类似6.数值小于R2 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析本讲稿第十九页,共七十六页估计标准误差估计标准误差 Sy1.对误差项 的标准差
11、的的一个估计值2.(指指用用自自变变量量x1,x2,x1,x2,预测因变量y时的平均预测误差)3.衡量多元回归方程的拟合优度4.计算公式为 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析本讲稿第二十页,共七十六页7.3 显著性检验显著性检验7.3.1 线性关系检验线性关系检验7.3.2 回归系数检验和推断回归系数检验和推断本讲稿第二十一页,共七十六页线性关系检验线性关系检验本讲稿第二十二页,共七十六页线性关系检验线性关系检验1.检验因变量与所有自变量之间的线性关系是否显著2.也被称为总体的显著性总体的显著性检验3.检验方法是将回归均方(MSR)同残差均方(MS
12、E)加以比较,应应用用 F 检检验验来分析二者之间的差别是否显著n n如如果果是是显显著著的的,因因变变量量与与自自变变量量之之间间存存在在线线性性关关系系n n如果不显著,因变量与自变量之间不存在线性关系如果不显著,因变量与自变量之间不存在线性关系本讲稿第二十三页,共七十六页线性关系检验线性关系检验1.提出假设假设n nH H0 0:1 1 2 2 k k=0 =0 线性关系不显著线性关系不显著n nH H1 1:1 1,2 2,k k至少有一个不等于至少有一个不等于0 02.计算计算检验统计量检验统计量F3.确定显著性水平 和分子自由度和分子自由度k、分母自由度n-kn-k-1找出临界值F
13、 F 4.作出决策:若F F F,拒绝,拒绝H0 0 Excel Excel 输出输出输出输出结果的分析结果的分析结果的分析结果的分析本讲稿第二十四页,共七十六页回归系数检验和推断回归系数检验和推断本讲稿第二十五页,共七十六页回归系数的检验回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第类错误(弃真错误)4.对每一个自变量都要单独进行检验5.应用 t 检验统计量本讲稿第二十六页,共七十六页回归系数的检验回归系数的检验(步骤步骤)1.提出假设n nH
14、H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.计算检验的统计量 t3.确定显著性水平,并进行决策 t t t t,拒绝,拒绝H H0 0;t t t t(25-2)=2.069(25-2)=2.069,所所以以均均拒拒绝绝原原假假设设,说说明明这这4 4个个自自变变量量两两两两之之间间都都有有显显著著的的相相关关关关系系2.2.由由 表表ExcelExcel输输 出出 的的 结结 果果 可可 知知,回回 归归
15、 模模 型型 的的 线线 性性 关关 系系 显显 著著(Significance-F(Significance-F1.03539E-061.03539E-060.067030=0.05=0.05)。这也暗示了模型中存在多重共线性。这也暗示了模型中存在多重共线性3.3.固固定定资资产产投投资资额额的的回回归归系系数数为为负负号号(-0.029193)(-0.029193),与与预预期期的不一致的不一致本讲稿第三十六页,共七十六页多重共线性问题的处理多重共线性问题的处理本讲稿第三十七页,共七十六页多重共线性多重共线性(问题的处理问题的处理)1.将一个或多个相关的自变量从模型中剔除,使保留的自变量尽
16、可能不相关2.如果要在模型中保留所有的自变量,则应n n避免根据 t 统计量对单个参数进行检验n n对因变量值的推断(估计或预测)限定在自变量样本值的范围内 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析本讲稿第三十八页,共七十六页提示提示1.在建立多元线性回归模型时,不要试图引入更多的自变量,除非确实有必要2.在社会科学的研究中,由于所使用的大多数数据都是非试验性质的,因此,在某些情况下,得到的结果往往并不令人满意,但这不一定是选择的模型不合适,而是数据的质量不好,或者是由于引入的自变量不合适 本讲稿第三十九页,共七十六页7.5 利用回归方程进行估计和预测利
17、用回归方程进行估计和预测软件应用软件应用本讲稿第四十页,共七十六页置信区间估计置信区间估计(例题分析例题分析)STATISTICASTATISTICA输出的不良贷款的输出的不良贷款的置信区间置信区间本讲稿第四十一页,共七十六页预测区间估计预测区间估计(例题分析例题分析)STATISTICASTATISTICA输出的不良贷款的输出的不良贷款的输出的不良贷款的输出的不良贷款的预测区间预测区间预测区间预测区间本讲稿第四十二页,共七十六页7.6 变量选择与逐步回归变量选择与逐步回归7.6.1 变量选择过程变量选择过程7.6.2 向前选择向前选择7.6.3 向后剔除向后剔除7.6.4 逐步回归逐步回归本
18、讲稿第四十三页,共七十六页变量选择过程变量选择过程1.1.在建立回归模型时,对自变量进行筛选在建立回归模型时,对自变量进行筛选2.2.选择自变量的原则是对统计量进行显著性检验选择自变量的原则是对统计量进行显著性检验n n将将一一个个或或一一个个以以上上的的自自变变量量引引入入到到回回归归模模型型中中时时,是是否否使使得得残残差差平平方方和和(SSESSE)有有显显著著减减少少。如如果果增增加加一一个个自自变变量量使使SSESSE的的减减少少是是显显著著的的,则则说说明明有有必必要要将将这这个个自自变变量量引引入入回回归归模模型型,否否则则,就就没没有有必要将这个自变量引入回归模型必要将这个自变
19、量引入回归模型n n确确定定引引入入自自变变量量是是否否使使SSESSE有有显显著著减减少少的的方方法法,就就是是使使用用F F统统计计量量的的值值作作为为一一个个标标准准,以以此此来来确确定定是是在在模模型型中中增增加加一一个个自自变变量量,还还是从模型中剔除一个自变量是从模型中剔除一个自变量3.3.变变量量选选择择的的方方法法主主要要有有:向向前前选选择择、向向后后剔剔除除、逐逐步步回回归归、最优子集等最优子集等 本讲稿第四十四页,共七十六页向前选择向前选择 (forward selection)1.从模型中没有自变量开始2.对k个自变量分别拟合对因变量的一元线性回归模型,共有k个,然后找
20、出F统计量的值最高的模型及其自变量,并将其首先引入模型 3.分别拟合引入模型外的k-1个自变量的线性回归模型 4.如此反复进行,直至模型外的自变量均无统计显著性为止本讲稿第四十五页,共七十六页向后剔除向后剔除 (backward elimination)1.先对因变量拟合包括所有k个自变量的回归模型。然后个自变量的回归模型。然后考察考察p(p p k k)个去掉一个自变量的模型(这些模型中每一个这些模型中每一个都有都有k-1个自变量),使模型的SSESSE值减小最少的自变量值减小最少的自变量被挑选出来并从模型中剔除被挑选出来并从模型中剔除2.考察p个再去掉一个自变量的模型(这些模型中每一个都有
21、k-2-2个的自变量个的自变量),使模型的,使模型的SSESSE值减小最少的自变量值减小最少的自变量被挑选出来并从模型中剔除被挑选出来并从模型中剔除3.如此反复进行,一直将自变量从模型中剔除,直至剔除一个自变量不会使SSE显著减小为止本讲稿第四十六页,共七十六页逐步回归逐步回归 (stepwise regression)1.1.将向前选择和向后剔除两种方法结合起来筛选自变量将向前选择和向后剔除两种方法结合起来筛选自变量2.2.在在增增加加了了一一个个自自变变量量后后,它它会会对对模模型型中中所所有有的的变变量量进进行行考考察察,看看看看有有没没有有可可能能剔剔除除某某个个自自变变量量。如如果果
22、在在增增加加了了一一个个自自变变量量后后,前前面面增增加加的的某某个个自自变变量量对对模模型型的的贡贡献献变变得得不不显显著,这个变量就会被剔除著,这个变量就会被剔除3.3.按按照照以以上上方方法法不不停停地地增增加加变变量量并并考考虑虑剔剔除除以以前前增增加加的的变变量的可能性,直至增加变量已经不能导致量的可能性,直至增加变量已经不能导致SSESSE显著减少显著减少4.4.在在前前面面步步骤骤中中增增加加的的自自变变量量在在后后面面的的步步骤骤中中有有可可能能被被剔剔除除,而而在在前前面面步步骤骤中中剔剔除除的的自自变变量量在在后后面面的的步步骤骤中中也也可可能能重重新新进进入到模型中入到模
23、型中本讲稿第四十七页,共七十六页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)Variable Entered/Removed a model model Variable EnteredVariable EnteredVariable Variable RemovedRemovedmethodmethod1 1各项贷款余额各项贷款余额各项贷款余额各项贷款余额x1 x1 Stepwise(Criteria:Probability-of-F-Stepwise(Criteria:Probability-of-F-to-enter=.050,to-enter=.050,Probabi
24、lity-of-F-to-remove=.100.Probability-of-F-to-remove=.100.2 2固定资产投资额固定资产投资额固定资产投资额固定资产投资额x4 x4 Stepwise(Criteria:Probability-of-F-Stepwise(Criteria:Probability-of-F-to-enter=.050,to-enter=.050,Probability-of-F-to-remove=.100.Probability-of-F-to-remove=.100.a Dependent variable:a Dependent variable:不良
25、贷款不良贷款y y本讲稿第四十八页,共七十六页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)Model summary model model R RR-SquareR-SquareAdjusted R-Adjusted R-SquareSquare Std.Error of the Std.Error of the EstimateEstimate 1 1.844.844a a.712.712.699.6991.97991.97992 2.872.872b b.761.761.739.7391.84281.8428a Predictors:(Constant),a Predi
26、ctors:(Constant),各项贷款余额各项贷款余额x1x1b Predictors:(Constant),b Predictors:(Constant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4本讲稿第四十九页,共七十六页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ANOVA c modelmodelmodelmodelSum of SquaresSum of SquaresSum of SquaresSum of SquaresdfdfdfdfMean SquareMean SquareMean SquareMean SquareF
27、F F FSig.Sig.Sig.Sig.1 Regress1 Regress1 Regress1 Regress Residual Residual Residual ResidualTotalTotalTotalTotal222.486222.486222.486222.48690.16490.16490.16490.164312.650312.650312.650312.6501 1 1 12323232324242424222.486222.486222.486222.4863.9203.9203.9203.92056.75456.75456.75456.754.000.000.000
28、.000a a a a2 Regress2 Regress2 Regress2 Regress Residual Residual Residual Residual Total Total Total Total237.941237.941237.941237.94174.70974.70974.70974.709312.650312.650312.650312.6502 2 2 22222222224242424118.971118.971118.971118.9713.3963.3963.3963.39635.03435.03435.03435.034.000.000.000.000b
29、b b ba Predictors:(Constant),a Predictors:(Constant),各项贷款余额各项贷款余额x1x1b Predictors:(Constant),b Predictors:(Constant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4c Dependent variable:c Dependent variable:不良贷款不良贷款y y本讲稿第五十页,共七十六页逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ModelModelUnstandardizedUnstandardizedCoefficients
30、CoefficientsUnstandardizedUnstandardizedCoefficientsCoefficientst tSig.Sig.B BStd.ErrorStd.ErrorBetaBeta1 (Constant)1 (Constant)贷贷款余款余额额x1 x1 -.830-.830.038.038.723.723.005.00508440844-1.147-1.1477.5347.534.263.263.000.0002 (Constant)2 (Constant)贷贷款余款余额额x1x1 固定固定资产资产投投资资x4x4-.443-.443.050.050-.032-.
31、032.697.697.007.007.015.0151.1201.120-.355-.355-.636-.6366.7326.732-2.133-2.133.531.531.000.000.044.044a Dependent variable:a Dependent variable:不良贷款不良贷款y yCoefficients a本讲稿第五十一页,共七十六页7.7 虚拟自变量的回归虚拟自变量的回归7.7.1 含有一个虚拟自变量的回归含有一个虚拟自变量的回归7.7.2 用虚拟自变量回归解决方差分析问题用虚拟自变量回归解决方差分析问题本讲稿第五十二页,共七十六页含有一个虚拟自变量的回归含有
32、一个虚拟自变量的回归本讲稿第五十三页,共七十六页虚拟自变量虚拟自变量(dummy variable)1.用数字代码表示的定性自变量2.虚拟自变量可有不同的水平n n只有两个水平的虚拟自变量只有两个水平的虚拟自变量l l比如,性别比如,性别(男,女男,女)n n有两个以上水平的虚拟自变量有两个以上水平的虚拟自变量l l贷款企业的类型贷款企业的类型(家电,医药,其他家电,医药,其他)3.虚拟变量的取值为0,1本讲稿第五十四页,共七十六页虚拟自变量的回归虚拟自变量的回归1.回归模型中使用虚拟自变量时,称为虚拟自变量的回归2.当虚拟自变量只有两个水平时,可在回归中引入一个虚拟变量n n比如,性别比如,
33、性别(男,女男,女)3.一般而言,如果定性自变量有k k个个水水平平,需需要要在在回回归归模型中引进模型中引进k k-1个虚拟变量本讲稿第五十五页,共七十六页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)【例例例例】为为了了研研究究考考试试成成绩绩与与性性别别之之间间的的关关系系,从从某某大大学学商商学学院院随随机机抽抽取取男男女女学学生生各各8名,得到他们的市场营销学课程的考试成绩如右表 本讲稿第五十六页,共七十六页虚拟自变量的回归虚拟自变量的回归(考试成绩与性别的散点图考试成绩与性别的散点图)男 女本讲稿第五十七页,共七十六页虚拟自变量的回归虚拟自变量的回归(成绩与性别的成绩与性别的
34、Mean/SD/1.96*SD箱线图箱线图)y y与与与与x x的回归的回归的回归的回归本讲稿第五十八页,共七十六页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)引进虚拟变量时,回归方程表示为E E(y y)=)=0+1x x 男男(x x=0)=0):E E(y y)=)=0 0男学生考试成绩的期望值男学生考试成绩的期望值 女女(x x=1)=1):E E(y y)=)=0 0+1 1 1 1女学生考试成绩的期望值女学生考试成绩的期望值 注意:当指定虚拟变量注意:当指定虚拟变量0 0,1时时 0 0总总是是代代表表与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水
35、水平平的的平平均值均值 1 1总总是是代代表表与与虚虚拟拟变变量量值值1 1所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均响响应应与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水水平平的的平均值的差值,即平均值的差值,即 平均值的差值平均值的差值 =(=(0 0+1)-)-0 0=1本讲稿第五十九页,共七十六页虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)【例例】为研究工资水平与工作年限和性别之间的关系,在某行业中随机抽取10名职工,所得数据如右表 y y与与与与x x1 1的回归及分析的回归及分析的回归及分析的回归及分析 y y与与与与x x1 1
36、,x x2 2的回归及分析的回归及分析的回归及分析的回归及分析本讲稿第六十页,共七十六页虚拟自变量的回归虚拟自变量的回归 (例题分析例题分析)引进虚拟变量时,回归方程写为引进虚拟变量时,回归方程写为 E E(y y)=)=0 0+1 1x x1 1+2 2x x2 2 女女(x x2 2=0)=0):E E(y y|女性女性)=)=0 0+1 1x x1 1 男男(x x2 2=1)=1):E E(y y|男性男性)=()=(0 0+2 2)+)+1 1x x1 1 0 0表示:女性职工的期望月工资收入表示:女性职工的期望月工资收入 (0 0+2 2)表示:男性职工的期望月工资收入表示:男性职
37、工的期望月工资收入 1 1表表示示:工工作作年年限限每每增增加加1 1年年,男男性性或或女女性性工工资资的的平平均均增加值增加值 2 2表表示示:男男性性职职工工的的期期望望月月工工资资收收入入与与女女性性职职工工的的期期望望月月工工资收入之间的差值资收入之间的差值 (0 0+2 2)-)-0 0=2 2本讲稿第六十一页,共七十六页用虚拟自变量回归用虚拟自变量回归解决方差分析问题解决方差分析问题本讲稿第六十二页,共七十六页方差分析的回归方法方差分析的回归方法 (例题分析例题分析)引进虚拟变量引进虚拟变量 建立回归方程:建立回归方程:E E(Y Y)=)=0 0+1 1x x1 1+2 2x x
38、2 2+3 3x x3 3 用用用用ExcelExcel进行回归进行回归进行回归进行回归 0 0家电制造业投诉次数的平均值家电制造业投诉次数的平均值 (0 0+1 1)零售业投诉次数的平均值零售业投诉次数的平均值 (0 0+2 2)旅游业投诉次数的平均值旅游业投诉次数的平均值 (0 0+3 3)航空公司投诉次数的平均值航空公司投诉次数的平均值 本讲稿第六十三页,共七十六页7.8 非线性回归非线性回归7.8.1 双曲线双曲线7.8.2 幂函数曲线幂函数曲线7.8.3 对数曲线对数曲线本讲稿第六十四页,共七十六页非线性回归非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线
39、性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型本讲稿第六十五页,共七十六页双曲线双曲线 0 0 01.基本形式:2.线性化方法令:令:y y =1/=1/y y,x x=1/=1/x x,则有则有y y =+x x 3.图像本讲稿第六十六页,共七十六页幂函数曲线幂函数曲线1.基本形式:2.线性化方法n n两端取对数得:两端取对数得:lg lg y y=lg=lg +lglg x xn n令:令:y y =lg=lgy y,x x=lg=lg x x,则则y y =lglg +x x 3.图像00 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1
40、 本讲稿第六十七页,共七十六页对数曲线对数曲线1.基本形式:2.线性化方法x x=ln=lnx x,则有则有y y =+x x 3.图像 0 0 0 0 本讲稿第六十八页,共七十六页指数曲线指数曲线1.基本形式:2.线性化方法两端取对数得:两端取对数得:lnlny y =ln=ln +x x令:令:y y =ln=lny y,则有,则有y y =lnln +x x3.图像 本讲稿第六十九页,共七十六页S 型曲线型曲线1.基本形式:2.线性化方法n n令:令:y y =1/=1/y y,x x=e=e-x x,则有则有y y =+x x3.图像本讲稿第七十页,共七十六页非线性回归非线性回归(例题
41、分析例题分析)【例例例例】一一种种商商品品的的需需求求量量与与其其价价格格有有一一定定的的关关系系。现现对对一一定定时时期期内内的的商商品品价价格格x x与与需需求求量量y y进进行行观观察察,取取得得的的样样本本数数据据如如下下表表。试试判判断断商商品品价价格格与与需需求求量量之之间间回回归归函函数数的的类类型型,并并求求需需求求量量对价格的回归方程对价格的回归方程废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系价格价格价格价格 (元元元元)x x1 12 23 34 45 56 67 78 89 91010需求量需求量需求量需求量(kg)(kg)y y585
42、8505044443838343430302929262625252424本讲稿第七十一页,共七十六页非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图本讲稿第七十二页,共七十六页非线性回归非线性回归 (例题分析例题分析)1.用双曲线模型:2.按线性回归的方法求解和,得本讲稿第七十三页,共七十六页非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图本讲稿第七十四页,共七十六页本章小结本章小结1.多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程2.2.回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度3.3.显著性检验显著性检验显著性检验显著性检验4.多重共线性多重共线性5.5.利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测6.6.虚拟自变量虚拟自变量虚拟自变量虚拟自变量的回归的回归7.7.非线性非线性非线性非线性回归回归回归回归8.方方差分析的回归方法差分析的回归方法本讲稿第七十五页,共七十六页结结 束束本讲稿第七十六页,共七十六页