《第七讲多元线性回归PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第七讲多元线性回归PPT讲稿.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七讲多元线性回归第七讲多元线性回归第1页,共76页,编辑于2022年,星期二统计应用统计应用预测大学足球比赛的获胜得分差额预测大学足球比赛的获胜得分差额 为为检检验验一一场场大大学学足足球球比比赛赛中中“争争球球码码数数”、“传传球球码码数数”、“回回传传次次数数”、“控控球球时时间间”以以及及“主主场场优优势势”等等变变量量对对比比赛赛最最后后得得分分的的影影响响,分分析析人人员员建建立立了了一一个个多多元元回回归归模模型型。该该模模型型的的因因变变量量是是“比比赛赛获获胜胜得得分分的的差差值值”,它它等等于于胜胜方方的的最最后后得得分分减去负方的最后得分减去负方的最后得分从从高高校校体体
2、育育协协会会前前2020名名球球队队的的比比赛赛中中随随机机抽抽取取了了9090场场,收收集集到到自自变变量量和和因因变变量量的的数数据据,并并进进行行多多元元回归分析,得到的回归结果如表回归分析,得到的回归结果如表预测变量预测变量预测变量预测变量系数系数系数系数t t值值值值截距截距3.223.222.062.06争球码数差争球码数差0.110.1112.5012.50传球码数差传球码数差0.090.0910.1910.19回传次数差回传次数差-2.80-2.80-5.75-5.75控球时间差控球时间差-0.01-0.01-3.94-3.94主场优势变量主场优势变量3.043.041.681
3、.68因变量:获胜得分差因变量:获胜得分差修正的修正的R R2 2=0.72=0.72第2页,共76页,编辑于2022年,星期二第第 7 讲讲 多元线性回归多元线性回归7.1 多元线性回归模型多元线性回归模型 7.2 回归方程的拟合优度回归方程的拟合优度7.3 显著性检验显著性检验7.4 多重共线性多重共线性7.5 利用回归方程进行估计和预测利用回归方程进行估计和预测7.6 变量选择与逐步回归变量选择与逐步回归7.7 虚拟自变量的回归虚拟自变量的回归7.8 非线性回归非线性回归第3页,共76页,编辑于2022年,星期二学习目标学习目标1.回归模型、回归方程、估计的回归方程回归模型、回归方程、估
4、计的回归方程2.回归方程的拟合优度回归方程的拟合优度3.回归方程的显著性检验回归方程的显著性检验4.多重共线性问题及其处理多重共线性问题及其处理5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.虚拟自变量的回归问题虚拟自变量的回归问题7.非线性回归非线性回归8.用用 Excel 进行回归分析进行回归分析第4页,共76页,编辑于2022年,星期二7.1 多元线性回归模型多元线性回归模型7.1.1 多元回归模型与回归方程多元回归模型与回归方程7.1.2 估计的多元回归方程估计的多元回归方程7.1.3 参数的最小二乘估计参数的最小二乘估计第5页,共76页,编辑于2022年,星期二多元回归模
5、型与回归方程多元回归模型与回归方程第6页,共76页,编辑于2022年,星期二多元回归模型多元回归模型(multiple regression model)1.1.一个因变量与两个及两个以上自变量的回归一个因变量与两个及两个以上自变量的回归2.2.描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x1 ,x x2 2 ,xk k 和和误差项误差项 的方程,称为多元回归模型3.3.涉涉及及 k k 个自变量的多元回归模型可表示为个自变量的多元回归模型可表示为 0 0 ,1 1,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2
6、,x xk k 的线性函数加上误差项的线性函数加上误差项 包包含含在在y y里里面面但但不不能能被被k k个个自自变变量量的的线线性性关关系系 所所解释的变异性解释的变异性第7页,共76页,编辑于2022年,星期二多元回归模型多元回归模型(基本假定基本假定)1.误差项是一个期望值为0的随机变量,即E()=02.对于自变量x1,x2,xk的所有值,的方差 2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立第8页,共76页,编辑于2022年,星期二多元回归方程多元回归方程(multiple regression equation)1.描述因变量 y 的平均值或期望值如何依赖
7、于自变量 x1,x2,xk的方程2.多元线性回归方程的形式为 E(y)=0+1 x1+2 x2+k xk 1 1,k k称为偏回归系数称为偏回归系数 i i 表表示示假假定定其其他他变变量量不不变变,当当 x xi i 每每变变动动一一个个单单位时,位时,y y 的平均变动值的平均变动值第9页,共76页,编辑于2022年,星期二二元回归方程的直观解释二元回归方程的直观解释二元线性回归模型二元线性回归模型二元线性回归模型二元线性回归模型(观察到的观察到的y y)回归面回归面 0 0 i ix x1 1y yx x2 2(x x1 1,x x2 2)第10页,共76页,编辑于2022年,星期二估计
8、的多元回归方程估计的多元回归方程第11页,共76页,编辑于2022年,星期二估计的多元回的方程估计的多元回的方程(estimated multiple regression equation)(estimated multiple regression equation)是是 估计值估计值 是是 y y 的估计值的估计值1.用样本统计量 估计回归方程中的 参数 时得到的方程2.由最小二乘法求得3.一般形式为第12页,共76页,编辑于2022年,星期二参数的最小二乘估计参数的最小二乘估计第13页,共76页,编辑于2022年,星期二参数的最小二乘法参数的最小二乘法2.2.求求解解各回归参数的标准方
9、程如下1.1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达达到到最最小来求得小来求得 。即。即第14页,共76页,编辑于2022年,星期二参数的最小二乘法参数的最小二乘法(例题分析例题分析)【例例】一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行20022002年的有关业务数据。试建立不良贷款y与贷款余额x x1 1、累累计计应应收收贷贷款款x x2 2、贷款项目个数x x3 3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义 用用Excel进行回归进行回归第15页,共76页,编辑于2022年,星期二7
10、.2 回归方程的拟合优度回归方程的拟合优度7.2.1 多重判定系数多重判定系数7.2.2 估计标准误差估计标准误差第16页,共76页,编辑于2022年,星期二多重判定系数多重判定系数第17页,共76页,编辑于2022年,星期二多重判定系数多重判定系数(multiple coefficient of determination)1.回归平方和占总平方和的比例2.计算公式为3.因变量取值的变差中,能被估计的多元回归方程所解释的比例 第18页,共76页,编辑于2022年,星期二修正多重判定系数修正多重判定系数(adjusted multiple coefficient of determinatio
11、nadjusted multiple coefficient of determination)1.用样本量n和自变量的个数k k去修正R2得到 2.计算公式为3.避免增加自变量而高估 R24.(消除了自变量个数及样本量个数的影响)5.意义与 R2类似类似6.数值小于R2 2 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第19页,共76页,编辑于2022年,星期二估计标准误差估计标准误差 Sy1.1.对误差项对误差项 的标准差 的的一个估计值一个估计值2.2.(指指用用自自变变量量x1,x2,x1,x2,预预测测因因变变量量y y时时的的平平均均预预测测误误
12、差差)3.3.衡量多元回归方程的拟合优度衡量多元回归方程的拟合优度4.计算公式为 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第20页,共76页,编辑于2022年,星期二7.3 显著性检验显著性检验7.3.1 线性关系检验线性关系检验7.3.2 回归系数检验和推断回归系数检验和推断第21页,共76页,编辑于2022年,星期二线性关系检验线性关系检验第22页,共76页,编辑于2022年,星期二线性关系检验线性关系检验1.1.检检验验因因变变量量与与所有自变量之间的线性关系是否显著2.也被称为总体的显著性总体的显著性总体的显著性总体的显著性检验3.检验方法是将回
13、归均方(MSR)同残差均方(MSE)加加以以比比较较,应应应应用用用用 F F 检检验验来分析二者之间的差别是否显著n n如果是显著的,因变量与自变量之间存在线性关系如果是显著的,因变量与自变量之间存在线性关系n n如如果果不不显显著著,因因变变量量与与自自变变量量之之间间不不存存在在线线性性关关系系第23页,共76页,编辑于2022年,星期二线性关系检验线性关系检验1.1.提出提出假设n nH H0 0:1 1 2 2 k k=0 =0 线性关系不显著线性关系不显著n nH H1 1:1 1,2 2,k k至少有一个不等于至少有一个不等于0 02.计算计算检验统计量F3.3.确定确定显著性水
14、平显著性水平 和分子自由度和分子自由度k k、分母自由度、分母自由度n-kn-k-1-1找找出临界值出临界值F F 4.4.作出作出决策:若F F F F,拒绝,拒绝H H0 0 Excel Excel 输出输出输出输出结果的分析结果的分析结果的分析结果的分析第24页,共76页,编辑于2022年,星期二回归系数检验和推断回归系数检验和推断第25页,共76页,编辑于2022年,星期二回归系数的检验回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第类错误(
15、弃真错误)4.对每一个自变量都要单独进行检验5.应用 t 检验统计量第26页,共76页,编辑于2022年,星期二回归系数的检验回归系数的检验(步骤步骤)1.提出假设n nH H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.计算检验的统计量 t3.确定显著性水平,并进行决策 t t t t,拒绝,拒绝H H0 0;t t t t(25-2)=2.069(25-2)=2.069,所所以以均均拒拒绝绝原原假假设设,说
16、说明明这这4 4个个自自变变量量两两两两之之间间都都有有显显著著的的相相关关关关系系2.2.由由 表表ExcelExcel输输 出出 的的 结结 果果 可可 知知,回回 归归 模模 型型 的的 线线 性性 关关 系系 显显 著著(Significance-F(Significance-F1.03539E-061.03539E-060.067030=0.05=0.05)。这也暗示了模型中存在多重共线性。这也暗示了模型中存在多重共线性3.3.固固定定资资产产投投资资额额的的回回归归系系数数为为负负号号(-0.029193)(-0.029193),与与预预期期的的不不一致一致第36页,共76页,编辑
17、于2022年,星期二多重共线性问题的处理多重共线性问题的处理第37页,共76页,编辑于2022年,星期二多重共线性多重共线性(问题的处理问题的处理)1.将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关2.如果要在模型中保留所有的自变量,则应n n避免根据 t 统计量对单个参数进行检验n n对因变量值的推断(估计或预测)限定在自变量样本值的范围内 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第38页,共76页,编辑于2022年,星期二提示提示1.在建立多元线性回归模型时,不要试图引入更多的自变量,除非确实有必要2.在社会科学的研究中,由于所使用
18、的大多数数据都是非试验性质的,因此,在某些情况下,得到的结果往往并不令人满意,但这不一定是选择的模型不合适,而是数据的质量不好,或者是由于引入的自变量不合适 第39页,共76页,编辑于2022年,星期二7.5 利用回归方程进行估计和预测利用回归方程进行估计和预测软件应用软件应用第40页,共76页,编辑于2022年,星期二置信区间估计置信区间估计(例题分析例题分析)STATISTICASTATISTICA输出的不良贷款的输出的不良贷款的输出的不良贷款的输出的不良贷款的置信区间置信区间置信区间置信区间第41页,共76页,编辑于2022年,星期二预测区间估计预测区间估计(例题分析例题分析)STATI
19、STICASTATISTICA输出的不良贷款的输出的不良贷款的输出的不良贷款的输出的不良贷款的预测区间预测区间第42页,共76页,编辑于2022年,星期二7.6 变量选择与逐步回归变量选择与逐步回归7.6.1 变量选择过程变量选择过程7.6.2 向前选择向前选择7.6.3 向后剔除向后剔除7.6.4 逐步回归逐步回归第43页,共76页,编辑于2022年,星期二变量选择过程变量选择过程1.1.在建立回归模型时,对自变量进行筛选在建立回归模型时,对自变量进行筛选2.2.选择自变量的原则是对统计量进行显著性检验选择自变量的原则是对统计量进行显著性检验n n将将一一个个或或一一个个以以上上的的自自变变
20、量量引引入入到到回回归归模模型型中中时时,是是否否使使得得残残差差平平方方和和(SSESSE)有有显显著著减减少少。如如果果增增加加一一个个自自变变量量使使SSESSE的的减减少少是是显显著著的的,则则说说明明有有必必要要将将这这个个自自变变量量引引入入回回归归模模型型,否否则则,就就没没有有必必要要将将这这个自变量引入回归模型个自变量引入回归模型n n确确定定引引入入自自变变量量是是否否使使SSESSE有有显显著著减减少少的的方方法法,就就是是使使用用F F统统计计量量的的值值作作为为一一个个标标准准,以以此此来来确确定定是是在在模模型型中中增增加加一一个个自自变变量量,还是从模型中剔除一个
21、自变量还是从模型中剔除一个自变量3.3.变变量量选选择择的的方方法法主主要要有有:向向前前选选择择、向向后后剔剔除除、逐逐步步回回归、最优子集等归、最优子集等 第44页,共76页,编辑于2022年,星期二向前选择向前选择 (forward selection)1.从模型中没有自变量开始2.对k个自变量分别拟合对因变量的一元线性回归模型,共有k个,然后找出F统计量的值最高的模型及其自变量,并将其首先引入模型 3.分别拟合引入模型外的k-1个自变量的线性回归模型 4.如此反复进行,直至模型外的自变量均无统计显著性为止第45页,共76页,编辑于2022年,星期二向后剔除向后剔除 (backward
22、elimination)1.1.先对因变量拟合包括所有先对因变量拟合包括所有k k个自变量的回归模型。然后考个自变量的回归模型。然后考察察p p(p k k)个去掉一个自变量的模型(这些模型中每一个这些模型中每一个都有都有k k-1-1个自变量个自变量),使模型的,使模型的SSESSE值减小最少的自变量值减小最少的自变量被挑选出来并从模型中剔除被挑选出来并从模型中剔除2.考察p p个再去掉一个自变量的模型个再去掉一个自变量的模型(这些模型中每一个都这些模型中每一个都有有k-2-2个的自变量个的自变量),使模型的SSE值减小最少的自变量值减小最少的自变量被挑选出来并从模型中剔除被挑选出来并从模型
23、中剔除3.如此反复进行,一直将自变量从模型中剔除,直至剔除一个自变量不会使SSESSE显著减小为止显著减小为止第46页,共76页,编辑于2022年,星期二逐步回归逐步回归 (stepwise regression)1.1.将向前选择和向后剔除两种方法结合起来筛选自变量将向前选择和向后剔除两种方法结合起来筛选自变量2.2.在在增增加加了了一一个个自自变变量量后后,它它会会对对模模型型中中所所有有的的变变量量进进行行考考察察,看看看看有有没没有有可可能能剔剔除除某某个个自自变变量量。如如果果在在增增加加了了一一个个自自变变量量后后,前前面面增增加加的的某某个个自自变变量量对对模模型型的的贡贡献献变
24、变得得不不显显著著,这这个个变量就会被剔除变量就会被剔除3.3.按按照照以以上上方方法法不不停停地地增增加加变变量量并并考考虑虑剔剔除除以以前前增增加加的的变变量量的的可能性,直至增加变量已经不能导致可能性,直至增加变量已经不能导致SSESSE显著减少显著减少4.4.在在前前面面步步骤骤中中增增加加的的自自变变量量在在后后面面的的步步骤骤中中有有可可能能被被剔剔除除,而而在在前前面面步步骤骤中中剔剔除除的的自自变变量量在在后后面面的的步步骤骤中中也也可可能能重重新新进入到模型中进入到模型中第47页,共76页,编辑于2022年,星期二逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)
25、Variable Entered/Removed a model model Variable EnteredVariable EnteredVariable Variable RemovedRemovedmethodmethod1 1各项贷款余额各项贷款余额各项贷款余额各项贷款余额x1 x1 Stepwise(Criteria:Probability-of-F-Stepwise(Criteria:Probability-of-F-to-enter=.050,to-enter=.050,Probability-of-F-to-remove=.100.Probability-of-F-to-re
26、move=.100.2 2固定资产投资额固定资产投资额固定资产投资额固定资产投资额x4 x4 Stepwise(Criteria:Probability-of-F-Stepwise(Criteria:Probability-of-F-to-enter=.050,to-enter=.050,Probability-of-F-to-remove=.100.Probability-of-F-to-remove=.100.a Dependent variable:a Dependent variable:不良贷款不良贷款y y第48页,共76页,编辑于2022年,星期二逐步回归逐步回归 (例题分析例题
27、分析SPSS输出结果输出结果)Model summary model model R RR-SquareR-SquareAdjusted R-Adjusted R-SquareSquare Std.Error of the Std.Error of the EstimateEstimate 1 1.844.844a a.712.712.699.6991.97991.97992 2.872.872b b.761.761.739.7391.84281.8428a Predictors:(Constant),a Predictors:(Constant),各项贷款余额各项贷款余额x1x1b Pred
28、ictors:(Constant),b Predictors:(Constant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4第49页,共76页,编辑于2022年,星期二逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ANOVA c modelmodelmodelmodelSum of SquaresSum of SquaresSum of SquaresSum of SquaresdfdfdfdfMean SquareMean SquareMean SquareMean SquareF F F FSig.Sig.Sig.Sig.1 Regress1
29、 Regress1 Regress1 Regress Residual Residual Residual ResidualTotalTotalTotalTotal222.486222.486222.486222.48690.16490.16490.16490.164312.650312.650312.650312.6501 1 1 12323232324242424222.486222.486222.486222.4863.9203.9203.9203.92056.75456.75456.75456.754.000.000.000.000a a a a2 Regress2 Regress2
30、Regress2 Regress Residual Residual Residual Residual Total Total Total Total237.941237.941237.941237.94174.70974.70974.70974.709312.650312.650312.650312.6502 2 2 22222222224242424118.971118.971118.971118.9713.3963.3963.3963.39635.03435.03435.03435.034.000.000.000.000b b b ba Predictors:(Constant),a
31、Predictors:(Constant),各项贷款余额各项贷款余额x1x1b Predictors:(Constant),b Predictors:(Constant),各项贷款余额各项贷款余额x1,x1,固定资产投资额固定资产投资额x4x4c Dependent variable:c Dependent variable:不良贷款不良贷款y y第50页,共76页,编辑于2022年,星期二逐步回归逐步回归 (例题分析例题分析SPSS输出结果输出结果)ModelModelUnstandardizedUnstandardizedCoefficientsCoefficientsUnstandard
32、izedUnstandardizedCoefficientsCoefficientst tSig.Sig.B BStd.ErrorStd.ErrorBetaBeta1 (Constant)1 (Constant)贷贷款余款余额额x1 x1 -.830-.830.038.038.723.723.005.00508440844-1.147-1.1477.5347.534.263.263.000.0002 (Constant)2 (Constant)贷贷款余款余额额x1x1 固定固定资产资产投投资资x4x4-.443-.443.050.050-.032-.032.697.697.007.007.01
33、5.0151.1201.120-.355-.355-.636-.6366.7326.732-2.133-2.133.531.531.000.000.044.044a Dependent variable:a Dependent variable:不良贷款不良贷款y yCoefficients a第51页,共76页,编辑于2022年,星期二7.7 虚拟自变量的回归虚拟自变量的回归7.7.1 含有一个虚拟自变量的回归含有一个虚拟自变量的回归7.7.2 用虚拟自变量回归解决方差分析问题用虚拟自变量回归解决方差分析问题第52页,共76页,编辑于2022年,星期二含有一个虚拟自变量的回归含有一个虚拟自变
34、量的回归第53页,共76页,编辑于2022年,星期二虚拟自变量虚拟自变量(dummy variable)1.用数字代码表示的定性自变量2.2.虚拟自变量可有不同的水平虚拟自变量可有不同的水平n n只有两个水平的虚拟自变量只有两个水平的虚拟自变量l l比如,性别比如,性别(男,女男,女)n n有两个以上水平的虚拟自变量有两个以上水平的虚拟自变量l l贷款企业的类型贷款企业的类型(家电,医药,其他家电,医药,其他)3.虚拟变量的取值为0,1第54页,共76页,编辑于2022年,星期二虚拟自变量的回归虚拟自变量的回归1.1.回回归归模模型型中中使使用用虚虚拟拟自自变变量量时时,称称为为虚虚拟拟自自变
35、变量量的的回回归归2.2.当当虚虚拟拟自自变变量量只只有有两两个个水水平平时时,可可在在回回归归中中引引入入一一个个虚拟变量虚拟变量n n比如,性别比如,性别(男,女男,女)3.一般而言,如果定性自变量有k个个水水平平,需需要要在在回回归归模型中引进模型中引进k k-1-1个虚拟变量第55页,共76页,编辑于2022年,星期二虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)【例例】为了研究考试成绩与性别之间的关系,从某大学商学院随机抽取男女学生各8 8名名,得得到到他他们们的的市市场场营营销销学学课课程程的的考考试试成成绩如右表绩如右表 第56页,共76页,编辑于2022年,星期二虚拟自变
36、量的回归虚拟自变量的回归(考试成绩与性别的散点图考试成绩与性别的散点图)男 女第57页,共76页,编辑于2022年,星期二虚拟自变量的回归虚拟自变量的回归(成绩与性别的成绩与性别的Mean/SD/1.96*SD箱线图箱线图)y y与与与与x x的回归的回归的回归的回归第58页,共76页,编辑于2022年,星期二虚拟自变量的回归虚拟自变量的回归(例题分析例题分析)引进虚拟变量时,回归方程表示为引进虚拟变量时,回归方程表示为E E(y y)=0+1 1x 男男(x x=0)=0):E E(y y)=)=0 0男学生考试成绩的期望值男学生考试成绩的期望值 女女(x x=1)=1):E E(y y)=
37、)=0 0+1 1 1 1女学生考试成绩的期望值女学生考试成绩的期望值 注意:当指定虚拟变量注意:当指定虚拟变量0,1 1时时 0 0总总是是代代表表与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均值值 1 1总总是是代代表表与与虚虚拟拟变变量量值值1 1所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均响响应应与与虚虚拟拟变变量量值值0 0所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均值值的差值,即的差值,即 平均值的差值平均值的差值 =(=(0 0+1 1)-0 0=1第59页,共76页,编辑于2022年,星期二虚拟自变量的
38、回归虚拟自变量的回归(例题分析例题分析)【例例例例】为研究工资水平与工作年限和性别之间的关系,在某行业中随机抽取1010名名职职工工,所所得得数数据据如右表如右表 y y与与与与x x1 1的回归及分析的回归及分析的回归及分析的回归及分析 y y与与与与x x1 1,x x2 2的回归及分析的回归及分析的回归及分析的回归及分析第60页,共76页,编辑于2022年,星期二虚拟自变量的回归虚拟自变量的回归 (例题分析例题分析)引进虚拟变量时,回归方程写为引进虚拟变量时,回归方程写为 E E(y y)=)=0 0+1 1x x1 1+2 2x x2 2 女女(x x2 2=0)=0):E E(y y
39、|女性女性)=)=0 0+1 1x x1 1 男男(x x2 2=1)=1):E E(y y|男性男性)=()=(0 0+2 2)+)+1 1x x1 1 0 0表示:女性职工的期望月工资收入表示:女性职工的期望月工资收入 (0 0+2 2)表示:男性职工的期望月工资收入表示:男性职工的期望月工资收入 1 1表表示示:工工作作年年限限每每增增加加1 1年年,男男性性或或女女性性工工资资的的平平均均增增加值加值 2 2表表示示:男男性性职职工工的的期期望望月月工工资资收收入入与与女女性性职职工工的的期期望望月工资收入之间的差值月工资收入之间的差值 (0 0+2 2)-)-0 0=2 2第61页,
40、共76页,编辑于2022年,星期二用虚拟自变量回归用虚拟自变量回归解决方差分析问题解决方差分析问题第62页,共76页,编辑于2022年,星期二方差分析的回归方法方差分析的回归方法 (例题分析例题分析)引进虚拟变量引进虚拟变量 建立回归方程:建立回归方程:E E(Y Y)=)=0 0+1 1x x1 1+2 2x x2 2+3 3x x3 3 用用用用ExcelExcel进行回归进行回归进行回归进行回归 0 0家电制造业投诉次数的平均值家电制造业投诉次数的平均值 (0 0+1 1)零售业投诉次数的平均值零售业投诉次数的平均值 (0 0+2 2)旅游业投诉次数的平均值旅游业投诉次数的平均值 (0
41、0+3 3)航空公司投诉次数的平均值航空公司投诉次数的平均值 第63页,共76页,编辑于2022年,星期二7.8 非线性回归非线性回归7.8.1 双曲线双曲线7.8.2 幂函数曲线幂函数曲线7.8.3 对数曲线对数曲线第64页,共76页,编辑于2022年,星期二非线性回归非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型第65页,共76页,编辑于2022年,星期二双曲线双曲线 0 0 01.基本形式:2.线性化方法令:令:y y =1/=1/y y,x x=1/=1/x x,则有则有y y
42、 =+x x 3.图像第66页,共76页,编辑于2022年,星期二幂函数曲线幂函数曲线1.基本形式:2.2.线性线性化方法n n两端取对数得:两端取对数得:lg lg y y=lg=lg +lglg x xn n令:令:y y =lg=lgy y,x x=lg=lg x x,则则y y =lglg +x x 3.图像图像00 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 第67页,共76页,编辑于2022年,星期二对数曲线对数曲线1.基本形式:2.线性化方法x x=ln=lnx x,则有则有y y =+x x 3.3.图像图像 0 0 0 0 第68页,共76页,编辑于20
43、22年,星期二指数曲线指数曲线1.基本形式:2.线性化方法两端取对数得:两端取对数得:lnlny y =ln=ln +x x令:令:y y =ln=lny y,则有,则有y y =lnln +x x3.图像 第69页,共76页,编辑于2022年,星期二S 型曲线型曲线1.1.基本形式:基本形式:2.线性化方法n n令:令:y y =1/=1/y y,x x=e=e-x x,则有则有y y =+x x3.图像第70页,共76页,编辑于2022年,星期二非线性回归非线性回归(例题分析例题分析)【例例例例】一一种种商商品品的的需需求求量量与与其其价价格格有有一一定定的的关关系系。现现对对一一定定时时
44、期期内内的的商商品品价价格格x x与与需需求求量量y y进进行行观观察察,取取得得的的样样本本数数据据如如下下表表。试试判判断断商商品品价价格格与与需需求求量量之之间间回回归归函函数数的的类类型型,并并求求需需求求量量对价格的回归方程对价格的回归方程废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系价格价格价格价格 (元元元元)x x1 12 23 34 45 56 67 78 89 91010需求量需求量需求量需求量(kg)(kg)y y5858505044443838343430302929262625252424第71页,共76页,编辑于2022年,星期二非
45、线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图第72页,共76页,编辑于2022年,星期二非线性回归非线性回归 (例题分析例题分析)1.用双曲线模型:2.按线性回归的方法求解和,得第73页,共76页,编辑于2022年,星期二非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图第74页,共76页,编辑于2022年,星期二本章小结本章小结1.1.多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程多元回归模型、回归方程、估计方程2.2.回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度回归方程的拟合优度3.3.显著性检验显著性检验显著性检验显著性检验4.4.多重共线性多重共线性多重共线性多重共线性5.5.利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测6.6.虚拟自变量虚拟自变量虚拟自变量虚拟自变量的回归的回归的回归的回归7.7.非线性非线性非线性非线性回归回归8.8.方方方方差分析的回归方法差分析的回归方法第75页,共76页,编辑于2022年,星期二结结 束束第76页,共76页,编辑于2022年,星期二