《计量经济学第三章多元线性回归模型.pptx》由会员分享,可在线阅读,更多相关《计量经济学第三章多元线性回归模型.pptx(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?中国汽车市场发展的状况如何?(用销售量观测)(用销售量观测)影响中国汽车销量的主要因素是什么?影响中国汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、能源、政策环境等)(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?各种因素对汽车销量影响的性质怎样?(正、负)(正、负)各种因素影响汽车销量的具体数量关系是什么?各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的中国汽车行业今后的
2、发展前景怎样?应当如何制定汽车的产业政策?产业政策?很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。怎样分析多种因素的影响?怎样分析多种因素的影响?第1页/共61页第三章第三章 多元线性回归模型多元线性回归模型 学习目的学习目的 理解多元线性回归模型的矩阵表示,掌握理解多元线性回归模型的矩阵表示,掌握多元线性回归模型的参数估计、检验。多元线性回归模型的参数估计、检验。第2页/共61页 基本要求基本要求 1)1)理解多元线性回归模型的矩阵表示,了解多元线性回归模型的基本假设;理解多元线性回归模型的矩阵表示,了解多元线性回归模型的基本假设;2)2)掌
3、握多元线性回归模型的普通最小二乘参数估计方法,了解多元线性回归掌握多元线性回归模型的普通最小二乘参数估计方法,了解多元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、多元线性回归模型的随机模型的普通最小二乘参数估计量与样本回归线的性质、多元线性回归模型的随机误差项方差的普通最小二乘参数估计;误差项方差的普通最小二乘参数估计;3)3)学会对多元线性回归模型进行拟合优度检验,对多元线性回归模型的参数学会对多元线性回归模型进行拟合优度检验,对多元线性回归模型的参数进行区间估计,对多元线性回归模型进行变量显著性检验和方程显著性检验;进行区间估计,对多元线性回归模型进行变量显著性检验和方程显著性
4、检验;4)4)学会利用学会利用EViewsEViews软件进行多元线性回归模型的参数估计、检验。软件进行多元线性回归模型的参数估计、检验。第三章第三章 多元线性回归模型多元线性回归模型第3页/共61页第一节第一节 多元线性回归模型的多元线性回归模型的 矩阵表示与基本假设矩阵表示与基本假设一、多元线性回归模型的矩阵表示一、多元线性回归模型的矩阵表示二、多元线性回归模型的基本假设二、多元线性回归模型的基本假设第4页/共61页第一节第一节 多元线性回归模型的多元线性回归模型的 矩阵表示与基本假设矩阵表示与基本假设多元线性回归模型的一般形式是 其中,Y为被解释变量,为解释变量,、为待估参数,即回归系数
5、,为解释变量个数,为随机误差项,为观测值下标,为样本容量。待估参数、,反映其他解释变量保持不变情况下,对应解释变量每变化一个单位引起的被解释变量的变化,也被称为偏回归系数。第5页/共61页一、多元线性回归模型的矩阵表示一、多元线性回归模型的矩阵表示(3-1)(3-2)习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样:模型中解释变量的数目为(k+1)第6页/共61页也被称为总总体体回回归归函函数数的随随机机表表达达形形式式。它 的非非随随机机表达式表达式为:方程表示:各变量各变量X X值固定时,值固定时,Y Y的平均响应的平均响应。j也被称为偏偏回回归归系系数数,表示在其
6、他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化;或者说j给出了Xj的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。第7页/共61页记有(3-3)多元线性总体回归模型的矩阵形式多元线性总体回归模型的矩阵形式 多元线性总体回归函数可用矩阵形式表示为(3-4)第8页/共61页样本回归函数样本回归函数:用来估计总体回归函数其随机表示式随机表示式:ei称为残差残差或剩余项剩余项(residuals),可看成是总体回归函数中随机扰动项 i的近似替代。:或其中:样本回归函数样本回归函数的矩阵表达矩阵表达:第9页/共61页二、多元线性回归模型的基本假定二、多元线性回归模型的
7、基本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性无多重共线性)。假设2,随机误差项具有零均值、同方差及不序列相关性 假设3,解释变量与随机项不相关 假设4,随机项满足正态分布 第10页/共61页上述假设的矩阵符号表示 式:假设1 1,n(k+1)+1)矩阵X是非随机的,且X的秩=k+1+1,即X矩阵列满秩。假设2 2,假设3,E(E(X)=0)=0,即 第11页/共61页假设4,向量 有一多维正态分布,即 假设5,回归模型的设定是正确的。且由第2条假设有 第12页/共61页第二节第二节 多元线性回归模型的多元线性回归模型的 参数估计参数估计 任务任务 方法方法 模
8、型结构参数、的估计 随机误差项的方差的估计 普通最小二乘法 第13页/共61页讲课内容讲课内容一、参数的普通最小二乘估计一、参数的普通最小二乘估计二、参数的普通最小二乘估计量的性质二、参数的普通最小二乘估计量的性质三、普通最小二乘样本回归函数性质三、普通最小二乘样本回归函数性质四、随机误差项的方差的普通最小二乘估计四、随机误差项的方差的普通最小二乘估计五、样本容量问题五、样本容量问题第14页/共61页一、参数的普通最小二乘估计一、参数的普通最小二乘估计对于多元线性回归模型(3-7)按照最小二乘法的基本思想,求参数的普通最小二乘估计,就是要求使、达到最小的参数的估计 。第15页/共61页根据最小
9、二乘原理最小二乘原理,参数估计值应该是下列方程组的解 其中第16页/共61页于是得到关于待估参数估计值的正规方程组正规方程组:第17页/共61页正规方程组正规方程组的矩阵形式矩阵形式即由于XX满秩,故有 第18页/共61页 例:例:在家庭可支配收入在家庭可支配收入-消费支出例中,对于所抽出消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表进行。的一组样本数,参数估计的计算可通过下面的表进行。第19页/共61页因此,因此,由该样本估计的回归方程为:由该样本估计的回归方程为:第20页/共61页在上述家庭收入-消费支出例中,如果用矩阵应该怎么求解?如果用矩阵应该怎么求解?可求得 于是
10、 第21页/共61页二、参数的普通最小二乘估计量的性质二、参数的普通最小二乘估计量的性质1 1线性性线性性因为 记矩阵的第 j 行第 i 列的元素为 aji,则是矩阵的 第 j+1 行与列矩阵 Y 的乘积,即这就是说,中的任意一个都可以表示为被解释变量的线性组合,满足线性性。、第22页/共61页二、参数的普通最小二乘估计量的性质二、参数的普通最小二乘估计量的性质2 2无偏性无偏性因为 所以第23页/共61页二、参数的普通最小二乘估计量的性质二、参数的普通最小二乘估计量的性质3 3有效性有效性因为 的方差-协方差矩阵为(3-16)(3-17)记矩阵的主对角线上的第i个元素为cii,则第24页/共
11、61页讲讲 课课 内内 容容一、参数的普通最小二乘估计一、参数的普通最小二乘估计二、参数的普通最小二乘估计量的性质二、参数的普通最小二乘估计量的性质三、普通最小二乘样本回归函数性质三、普通最小二乘样本回归函数性质四、随机误差项的方差的普通最小二乘估计四、随机误差项的方差的普通最小二乘估计五、样本容量问题五、样本容量问题第25页/共61页三、普通最小二乘样本回归函数性质三、普通最小二乘样本回归函数性质 1样本回归线通过样本均值点,即点(,)满足 。样本回归函数。3残差和为零,即 。2被解释变量的估计的均值等于被解释变量的均值,即 。4各解释变量与残差的乘积之和为零,即 。5被解释变量的估计与残差
12、的乘积之和为零,即 。第26页/共61页四、随机误差项的方差的普通最小二乘估计四、随机误差项的方差的普通最小二乘估计多元线性回归模型的随机误差项的方差的普通最小二乘估计量为 (3-18)是一个无偏估计量。容易看出,多元线性回归模型的随机误差项的方差的普通最小二乘估计量,与一元线性回归模型的随机误差项的方差的普通最小二乘估计量一致。因为在一元线性回归模型中k=1。所以,残差平方和可用矩阵表示为(3-19)第27页/共61页五、样本容量问题五、样本容量问题 样本容量越大,样本观测数据对经济活动的反映越全面,从样本观测数据中发现规律的可能性就越大,计量经济研究的结果就越可靠。参数估计的最小样本容量要
13、求是满足基本要求的样本容量:模型的检验要求有足够大的样本容量,z 检验在 n 30 时不能使用,因为n 30时构造不出用于检验的服从标准正态分布的统计量;t 检验在时才比较有效,因为时 t 分布才比较稳定。一般经验认为,当或者至少时,才能满足基本要求。模型的良好性质只有在大样本下才能得到理论上的证明模型的良好性质只有在大样本下才能得到理论上的证明 无多重共线性无多重共线性,秩秩(X)=(X)=k k+1+1第28页/共61页第三节第三节 多元线性回归模型的拟合优度检验多元线性回归模型的拟合优度检验一、离差分解一、离差分解二、决定系数二、决定系数三、调整的决定系数三、调整的决定系数第29页/共6
14、1页一、离差分解一、离差分解所以,在多元线性回归模型中,依然有(3-20)即(3-21)注意:注意:一个有趣的现象一个有趣的现象第30页/共61页 可决系数可决系数该统计量越接近于1,模型的拟合优度越高。问题:在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大 这就给人一个错觉:要使得模型拟合得好,只要增加要使得模型拟合得好,只要增加解释变量即可解释变量即可。但是并不是每个解释变量都有效的但是并不是每个解释变量都有效的.为了为了获得更加精简的模获得更加精简的模 型型,修正可决系数修正可决系数,对引入的解释变量对引入的解释变量个数进行惩罚。个数进行惩罚。R2需调整。第31页/共61页三
15、、调整的决定系数三、调整的决定系数(adjusted coefficient of determinationadjusted coefficient of determination)(3-22)其中,是残差平方和的自由度,是总体平方和的自由度。平方和与总体平方和得到,计算公式为,通过用自由度调整决定系数R2中的残差调整的决定系数,记作 R2由 的计算公式,可得调整的决定系数 与决定系数R2之间的关系R2R2 (3-23)第32页/共61页 赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的
16、标准还有的拟合优度,常用的标准还有:赤池信息准则赤池信息准则(Akaike information criterion,AIC)施瓦茨准则施瓦茨准则(Schwarz criterion,SC)这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。第33页/共61页表3-1 某商品的销售量、价格、售后服务支出数据序号序号销售量销售量Y (千个)(千个)价格价格X1(元(元/个)个)售后服务支出售后服务支出X2(万元)(万元)123456789101112131415161718
17、19202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例例3-23-2假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,求多元线性回归模型的决定系数R2与调整的决定系数 。R2第34页/共61页析:析:i 1234567891
18、0111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512111.6543131.1411127.0208118.1791128.2230147.7098148.3109163.0763158.9560159.5
19、571160.1582160.7593189.6890195.0115190.8912191.4923206.2576202.1373202.7384203.3395232.2692223.42742454.7571409.6651643.9381984.3021563.847554.391508.300133.299111.208211.572241.663183.48171.479340.56989.388155.115989.386867.568927.4771053.2957648.2904026.4743468.1721552.7051894.4002742.2451791.1935
20、21.469494.37755.789134.317120.745107.89695.770366.472598.584413.946438.7671275.357998.0431036.3841075.4483809.8142796.50087.3423.4558.87661.1677.7120.5040.09716.6161.09012.65326.60714.132114.25336.138118.61772.11918.1284.5683.0220.115662.075111.779求和求和375227169.4525788.391381.065平均平均170.5455表3-2 TSS
21、、ESS、RSS计算表第35页/共61页据表3-2可计算决定系数为调整的决定系数为第36页/共61页 第四节第四节 多元线性回归模型的统计推断多元线性回归模型的统计推断一、参数估计量的分布一、参数估计量的分布二、参数的区间估计二、参数的区间估计三、参数的假设检验三、参数的假设检验第37页/共61页一、参数估计量的分布一、参数估计量的分布满足基本假设条件下,多元线性回归模型参数的普通最小二乘估计量 服从正态分布。已知其中,是矩阵的主对角线上的第个元素。所以 第38页/共61页进行标准化变换可得记的标准差(standard error)为 第39页/共61页替代令的样本方差的样本标准差 第40页/
22、共61页服从自由度为n-k-1的t 分布替代令(3-25)将替代后的统计量记为,有 第41页/共61页参数的区间估计,即是求参数的置信区间,是在给定显著性水平对参数的取值范围作出估计,参数的真实值落入这一区间的概率为。之下,区间 二、参数的区间估计二、参数的区间估计第42页/共61页由此可得所以,在 显著性水平下,参数 的置信区间分别为(3-26)第43页/共61页如何才能缩小置信区间?如何才能缩小置信区间?增大样本容量n n,因为在同样的样本容量下,n n越大,t t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度,因为样本参数估计量的标准差与残
23、差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,(XX)-1的分母的|XX|的值越大,致使区间缩小。第44页/共61页参数的假设检验 检验对模型参数所作的某一个假设是否成立基础是参数估计量的分布性质采用的方法是统计学中的假设检验三、参数的假设检验三、参数的假设检验在多元线性回归模型中,常针对参数是否为0的假设进行检验 变量显著性检验(t 检验)方程显著性检验(F检验)针对单个解释变量对被解释变量的影响是否显 著所作的检验,检验被检验变量的参数为0是否 显著成立;都为0针对所有解释变量对被解释变量的联合影响是否 显著所作的检验,检验 是否显著
24、成立。第45页/共61页,对第j个解释变量的显著性进行检验,原假设为,备择假设,根据原假设,有(3-27),如果,接受原假设则拒绝原假设,接受备择假设。利用 t 分布进行参数的假设检验,称为 t 检验。1变量显著性检验(t 检验)从而判定对应的解释变量是否应包括在模型中。从而判定对应的解释变量是否应包括在模型中。第46页/共61页表3-1 某商品的销售量、价格、售后服务支出数据序号序号销售量销售量Y (千个)(千个)价格价格X1(元(元/个)个)售后服务支出售后服务支出X2(万元)(万元)12345678910111213141516171819202122121133130126131147
25、148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例例3-43-4假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,对多元线性回归模型进行变量显著性检验,显著性水平取0.01。第47页/共61页析:析:首先检验解释变量的显著性。原假设,备择假设已知,有所以拒绝原假设,接受备
26、择假设影响显著 查t分布表可得,第48页/共61页接下来检验解释变量 的显著性。原假设,备择假设已知,有影响显著 所以拒绝原假设,接受备择假设也可以通过比较显著性水平和参数估计值的P值,判断对应解释变量的显著性 第49页/共61页2方程显著性检验(F F检验)利用 F分布进行参数的假设检验,称为 F检验。基础是离差分解 针对原假设备择假设不全为0 作出检验。在离差分解的基础上,通过构造 F 统计量第50页/共61页表3-1 某商品的销售量、价格、售后服务支出数据序号序号销售量销售量Y (千个)(千个)价格价格X1(元(元/个)个)售后服务支出售后服务支出X2(万元)(万元)1234567891
27、0111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例例3-53-5假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,对多元线性回归模型进行方程显著性检验,显著性水平取0.01。第51页/共
28、61页析:析:影响显著 原假设 ,备择假设 不全为0已知,查F分布表得拒绝原假设接受备择假设 不全为0第52页/共61页3 3变量显著性检验与方程显著性检验的关系1)变量显著性检验是针对单个解释变量对被解释变量的影响是否 显著所作的检验,方程显著性检验是针对所有解释变量对被解 释变量的联合影响是否显著所作的检验;2)在多元线性回归模型中,变量显著性检验与方程显著性检验都 要进行,不能相互替代;3)在一元线性回归模型中,变量显著性检验(t检验)与方程显著 性检验(F检验)是一致的,一般只进行变量显著性检验。第53页/共61页4 4拟合优度检验与方程显著性检验的关系 联系:联系:(3-30)(3-
29、31)(3-29)(3-32)第54页/共61页区别:区别:4 4拟合优度检验与方程显著性检验的关系 方程显著性检验可在给定显著性水平下,给出模型总体线性关系是否显著成立的统计意义上的严格的结论。拟合优度检验只是通过决定系数和调整的决定系数模型拟合优度的度量,并没有提供模型是否通过检验的明确界限;提供了对第55页/共61页第五节、模型类型与变换 倒数模型、多项式模型与变量的直接置换法 幂函数模型、指数函数模型与函数变换法 复杂函数模型与级数展开法 第56页/共61页(一)倒数模型、多项式模型与变量的直接置换法 商品的需求曲线令 ,将方程变为Q=a+bX+第57页/共61页 拉弗曲线(Laffer Curve):描述税收s与税率r的关系。s=a+br+cr2+令X=r2,将方程变为s=a+br+cX+关于解释变量的非线性问题,都可以通过变量置换变成线性问题。第58页/共61页(二)幂函数模型、指数函数模型与函数变换法 Cobb-Dauglas生产函数Q=AKLe方程两边取对数lnQ=lnA+lnK+lnL+第59页/共61页 生产成本C与产量Q的关系C=abQe方程两边取对数lnC=lna+Qlnb+关于参数的非线性问题,采用函数变换法。第60页/共61页感谢您的观看!第61页/共61页