《中级计量经济学 第2章一元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《中级计量经济学 第2章一元线性回归模型.ppt(106页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第2 2章章 一元线性回归模型一元线性回归模型 2.1 一元线性回归模型的基本假定 2.1.1 2.1.1 一元线性回归模型一元线性回归模型 事事物物规规律律性性的的表表象象可可以以分分为为两两类类:一一类类为为随随机机现现象象;一一类类为为非非随随机机现现象象。对对于于数数量量性性质质的的事事物物,表表达达随随机机现现象象的的数数量量称称之之为为随随机机变变量量,表表达达非非随随机机现现象象的的数量称之为确定性变量或非随机变量。数量称之为确定性变量或非随机变量。各各种种经经济济变变量量之之间间的的关关系系,可可以以划划分分为为两两类类:一一类类是是完完全全确确定定的的函函数数关关系系,另一
2、类是非确定性的相关关系。另一类是非确定性的相关关系。建建立立模模型型的的意意义义:在在经经济济领领域域,一一个个变变量量的的变变化化常常常常受受其其他他多多个个经经济济变变量量的的影影响响。为为描描述述这这些些变变量量之之间间的的关关系系,研研究究这这些些变变量量之之间间的的变变化化规规律律,通通常常要要建立计量经济模型,研究模型参数,进而利用计量经济模型进行预测。建立计量经济模型,研究模型参数,进而利用计量经济模型进行预测。其中,u为随机误差项。最简单的形式为一元线性回归模型:“线性”一词在这里有两重含义。它一方面指被解释变量y与解释变量x之间为线性关系,即 2.1.2 随机误差项的性质 产
3、生误差项的原因主要有以下几方面:1模型中被忽略掉的影响因素造成的误差 2模型关系设定不准确造成的误差 3变量的测量误差 4变量的内在随机性 2.1.3 一元线性回归模型的基本假定 设一元线性回归模型为 满足以上古典假设的线性回归模型,也称为古典线性回归模型。2.2 一元线性回归模型的参数估计 对于一元线性总体回归模型:图2.2.1 观测值散点图2.2.1 普通最小二乘法(OLS)例2.2.1 某地区居民家庭可支配收入与家庭消费支出的资料如表2.2.1所示(单位:百元)。表2.2.1 某地区居民家庭收入支出资料 一一般般是是根根据据样样本本数数据据建建立立样样本本回回归归函函数数(或或样样本本回
4、回归归模模型型),用用样样本本回回归归方方程程(或或样样本本回回归归模模型型)作作为为总总体体回回归归函函数数(或或总总体体回回归归模模型型)的的估估计计式式并并以以此此描描述述总总体体变变量量间间的的依依存存规规律律和和实实际际关关系。系。总总体体回回归归模模型型与与样样本本回回归归模模型型的的主主要要区区别别是是:(1)(1)描描述述的的对对象象不不同同。(2)(2)建建立立模模型型的的依依据据不不同同。(3)(3)模模型型性性质质不不同同。总总体体回回归归模模型型与与样样本本回回归归模模型型的的联联系系是是:样样本本回回归归模模型型是是总总体体回回归归模模型型的的一一个个估估计计式式,之
5、之所所以以建建立立样样本本回回归归模模型型,目目的的是是用用来来估估计计总体回归模型。总体回归模型。2.2.2 最小二乘估计量的性质 一一个个用用于于考考察察总总体体的的估估计计量量,可可从从如如下下几几个个方方面面考考察察其其优优劣性:劣性:(1 1)线性。)线性。即它是否是另一个随机即它是否是另一个随机变变量的量的线线性函数;性函数;(2 2)无偏性。)无偏性。即它的均即它的均值值或期望是否等于或期望是否等于总总体的真体的真实值实值;(3 3)有有效效性性。即即它它是是否否在在所所有有的的线线性性无无偏偏估估计计量量中中具具有有最小方差;最小方差;(4 4)渐渐近近无无偏偏性性。即即样样本
6、本容容量量趋趋于于无无穷穷大大时时,它它的的均均值值序列序列趋趋于于总总体的真体的真值值;(5 5)一一致致性性。即即样样本本容容量量趋趋于于无无穷穷大大时时,它它是是否否依依概概率率收收敛敛于于总总体的真体的真值值;(6 6)渐渐近近有有效效性性。即即样样本本容容量量趋趋于于无无穷穷大大时时,它它在在所所有有的一致估的一致估计计量中具有最小的量中具有最小的渐渐近方差。近方差。这这里里,前前三三个个准准则则也也称称作作估估计计量量的的小小样样本本性性质质,因因为为一一旦旦某某估估计计量量具具有有该该类类性性质质,它它是是不不以以样样本本的的大大小小而而改改变变的的。拥拥有有这这类类性性质质的的
7、估估计计量量称称为为最最佳佳线线性性无无偏偏估估计计量量(BLUE(BLUE:best best linear linear unbiased unbiased estimators)estimators)。后后三三个个准准则则称称为为估估计计量量的的大大样样本本或或渐渐近近性性质质。如如果果小小样样本本情情况况下下不不能能满满足足估估计计的的准准则则,则应该扩则应该扩大大样样本容量,考察参数估本容量,考察参数估计计量的大量的大样样本性本性质质。用用最最小小二二乘乘法法得得到到的的参参数数估估计计,具具有有线线性性、无无偏偏性性和和有有效性(或最小方差性)三种最重要的效性(或最小方差性)三种最
8、重要的统计统计性性质质。1.1.线性线性最小方差性证明略。2.2.3 回归参数的区间估计 3回归系数的区间估计 2.3 一元线性回归模型的假设检验2.3.1 2.3.1 模型估计式检验的必要性模型估计式检验的必要性 1 1模型解模型解释变释变量量选择选择的正确性需要的正确性需要证证明明 2 2模型函数形式的正确性需要模型函数形式的正确性需要验证验证 3 3模型估模型估计计的可靠性需要的可靠性需要评评价价2.3.2 2.3.2 模型估计式的理论检验模型估计式的理论检验 线线性性回回归归模模型型估估计计式式的的理理论论检检验验,是是对对模模型型估估计计式式在在理理论论上上能能否否成成立立进进行行判
9、判别别。理理论论检检验验又又称称为为符符号号检检验验,依依据据模模型型参参数数最最小小二二乘乘估估计计值值的的符符号号(正正号号或或负负号号)及及取取值值的的大大小小,评评判判其其是是否否符符合合经济经济理理论论的的规规定或社会定或社会经济实经济实践的常践的常规规。2.3.3 回归参数的显著性检验 假设检验的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。其基本思想是:在某种原假设成立的条件下,利用适当的统计量和给定的显著性水平,构造个小概率事件,可以认为小概率事件在一次观察中基本不会发生,如果该事件竟然发生了,就认为原假设不真,从而拒绝原假设,接受备择假设。对于
10、一元线性回归模型而言,通常最关心的问题是解释变量对被解释变量是否有显著影响。p p值判别法:值判别法:在前面阐述的统计假设检验的基本原理中,是通过比较t统计量与临界值的大小来判断拒绝还是接受原假设的。与查找临界值的一个等价判别方法就是p值判别法。EViews软件提供了这种判别方法。2.3.4 拟合优度的测度与相关系数检验 样本回归直线与样本观测数据之间的拟合程度,称为样本回归线的拟合优度。1总变差的分解 样本回归函数:3 3相关系数检验相关系数检验 (1)变量相关的定义和分类 相关:相关:指两个或两个以上变量间相互关系的程度或强度。按相关的强度分为4类。完全相关完全相关:指两个变量间存在函数关
11、系(见图2.3.3)。高度相关高度相关(或强相关):(或强相关):变量间近似存在函数关系(见图2.3.4)。弱相关弱相关:变量间有关系但不明显(见图2.3.5)。零相关:零相关:变量间不存在任何关系(见图2.3.6)。按变量个数,相关可分为两类。按变量个数,相关可分为两类。简简单单相相关关:指两个变量之间的相关。当变量相关关系散布图上的点接近一条直线时,称为线性相关;当变量相关关系散布图上的点接近于一条曲线时,称为非线性相关。简单相关按符号又可分为正正相相关关(见图2.3.4)、负负相相关关(见图2.3.8)和零零相相关关(见图2.3.6)。两个变量趋于在同一个方向变化时,即同增或同减,称为变
12、量之间存在正相关;当两个变量趋于在相反方向变化时,即当一个变量增加,另一个变量减少时,称为变量之间存在负相关;当两个变量的变化相互没有关系时,称为二者不相关或零相关。复复相相关关:指三个或三个以上变量之间的相关。其中包括多重相关和偏相关。(2)线性相关的度量 变量之间线性相关的程度,常用相关系数去度量。两个变量x和y的总体相关系数为 (3)相关分析与回归分析、决定系数与相关系数的关系 相关分析与回归分析的关系。两者之间的区别表现在以下几个方面:第一,回归分析强调因果关系,相关分析不关心因果关系。第三,回归分析对资料的要求是:被解释变量y是随机变量,解释变量x是非随机变量。相关分析对资料的要求是
13、:两个变量都是随机变量。两两者者之之间间的的联联系系:第一,相关分析是回归分析的基础和前提。第二,回归分析是相关分析的深入和继续。第三,相关分析与回归分析的有关指标之间存在计算上的内在联系,下面将给出具体的数学表达式。(4)相关系数的显著性检验 总体y与x是否显著线性相关,必须进行相关系数的显著性检验,简称相关检验。检验相关系数的显著性有两种常用方法。使用相关系数临界值表。设定原假设和备择假设分别是2.3.5 正态性检验:JarqueBera检验2.4 一元线性回归模型的预测2.4.1 回归结果的报告形式与分析 1.回归结果提供的格式 对于表2.2.1中随机样本,用OLS所作的回归分析结果得到
14、:号内的数字分别是在对应参数等于0的原假设下,所计算的t统计量。2回归结果的分析 结果的分析主要包括以下内容:(1)系数的说明。(2)拟合情况。(3)系数的显著性,回归方程的显著性。(4)根据DW检验值说明是否存在误差项的自相关。2.4.2 回归预测 1点预测 假定总体回归模型和总体回归方程:2.4.3 影响预测区间大小的因素由式(2.4.5)和式(2.4.10)可以看出,影响预测区间大小的因素有四个:2.5 案例分析我国消费支出模型2.5 案例分析我国消费支出模型年份最终消费(y)国内生产总值(x)年份最终消费(y)国内生产总值(x)19782239.13624.1199011365.218
15、547.919792619.44038.2199113145.921617.819802976.14517.8199215952.126638.119813309.14862.4199320182.134634.419823637.95294.7199426796.046759.419834020.55934.5199533635.058478.119844694.57171.0199640003.967884.619855773.08964.4199743579.474462.619866542.010202.2199846405.978345.219877451.211962.519994
16、9722.782067.519889360.114928.3200054616.789442.2198910556.516909.2200158952.695933.3散点图如图2.5.1所示:图2.5.1 最终消费支出与国内生产总值散点图 2.5.1 创建工作文件 建立工作文件的方法:1 菜 单 方 式:方 法 是 在 主 菜 单 上 依 次 点 击File/New/Workfile,选择新建对象的类型为工作文件。这时屏幕上出现Workfile Range对话框(图2.5.2):图2.5.2 Workfile Range对话框 选择数据类型和起止日期:时间序列提供起止日期(年、季度、月度、周
17、、日),非时间序列提供最大观察个数。本例中在Start Data里键入1978,在End Data里键入2001。点击OK后屏幕出现Workfile工作框(图2.5.3)。图2.5.3 Workfile工作框 2命令方式:在命令窗口也可以直接输入建立工作文件的命令CREATE,命令格式为CREATE 数据频率 起始期 终止期 其中,数据频率类型分别为A(年)、Q(季)、M(月),U(非时间序列数据)。输入EViews命令时,命令字与命令参数之间只能用空格分隔。如本例可键入命令:CREATE A 1978 2001。2.5.2 输入和编辑数据 1data命令方式 命令格式:data 功能:输入新
18、变量的数据,或编辑工作文件中现有变量的数据。在本例中,可在光标处直接输入:Data y x2菜单方式在主菜单上点击Objects/New object,在New Object对话框里选Group并在Name for Object上定义变量名(如变量x、y),点击OK,屏幕出现数据编辑框。录入结果如表2.5.2所示:表2.5.2 统计数据录入结果 数据输入完毕,可以关闭数据输入窗口,点击工作文件窗口工具条的Save或点击菜单栏的FileSave将数据存入磁盘。2.5.3 图形分析1菜单方式 在数组窗口工具条上Views的下拉式菜单中选择Graph(图形);2命令方式 趋势图:plot y x 功
19、能:(1)分析经济变量的发展变化趋势;(2)观察经济变量是否存在异常值。图2.5.4给出了表2.5.1中最终消费支出与国内生产总值的趋势图。图2.5.4 趋势图 相关图:scat y x 功能:(1)观察经济变量之间的相关程度;(2)观察经济变量之间的相关类型,即为线性相关,还是曲线相关,曲线相关时,大致是哪种类型的曲线。双击图形区域中任意处,进入图形编辑状态(见图2.5.5)。图2.5.5 图形编辑状态 图2.5.6 数组窗口 由组的观察(View)查看组内序列的数据特征:按下数组窗口(也可以成为数组或数据编辑窗口)工具条上Views按钮,可以得到组内数据的特征,见图2.5.6。2.5.4
20、用OLS估计模型中的未知参数 1 菜 单 方 式:在 主 页 上 选 Quick菜 单,点 击 Estimate Equation项,屏幕出现估计对话框(Equation Speicfication,在Estimation Settings中选OLS估计,即Least Squares,键入:y c x (c为EViews固定的截距项系数)。然后OK,得如下输出结果(见表2.5.3)。2命令方式:LS y c x 表2.5.3 回归结果 表2.5.3中各项统计结果解释如下:常数和解释变量参数估计值参数标准差t统计量双侧概率C199.8150204.55510.9768270.3393X0.595
21、9770.004501132.42450.0000判定系数0.998747被解释变量均值19897.37调整的判定系数0.998690被解释变量标准差19006.77回归方程标准差687.9103赤池信息准则15.98485残差平方和10410853施瓦兹信息准则16.08302似然函数的对数-189.8182F统计量17536.24D-W统计量0.333719F统计量的概率0.000000 2.5.5 模型检验 1.经济意义检验 经济意义检验就是根据经济理论判断估计参数的正负符号是否合理、大小是否适当。经济意义检验要求同学具备较扎实的经济理论基础。3拟合优度检验 拟合优度是指样本回归直线与样
22、本观测数据之间的拟合程度,用样本决定系数的大小来表示。决定系数用来描述解释变量对被解释变量的解释程度。就本题而言,2.5.6 预测 我们还可以在估计出的Equation框里选Forecast项,EViews自动计算出样本估计期内的被解释变量的拟合值,拟合变量记为yf,其拟合值与实际值的对比图形见图2.5.7。图2.5.7 拟合值与实际值 点击方程窗口中的Resid按钮,将显示模型的拟合图和残差图(见图2.5.8):图2.5.8 拟合值、实际值与残差(a)点击方程窗口中的ViewActual,Fitted,ResidTable按钮,可以得到拟合值和残差的有关结果(见图2.5.9):图2.5.9 拟合值、实际值与残差(b)表2.5.5 描述统计结果 根据此表可计算如下结果:一元线性回归模型小结一、模型形式二、模型假定三、模型参数估计1估计方法:OLS四、模型检验1经济意义检验2统计准则检验 五、模型应用:经济预测