《线性回归模型.ppt》由会员分享,可在线阅读,更多相关《线性回归模型.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第2章章 一元线性回归模型一元线性回归模型 模型的建立及其假定条件模型的建立及其假定条件最小二乘估计(最小二乘估计(OLS)OLS回归函数的性质回归函数的性质最小二乘估计量的特性最小二乘估计量的特性yt的分布和的分布和 的分布的分布 的估计的估计 拟合优度的测量拟合优度的测量回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间yF 的点预测与区间预测的点预测与区间预测案例分析案例分析相关系数相关系数EViews操作操作file:li-2-1file:li-2-3file:case1第第2章章 一元线性回归模型一元线性回归模型 1.模型的建立及其假定条件模型的建立及其假定条件 一元线性
2、回归模型一元线性回归模型 yt=0+1 xt+ut (第(第2版教材第版教材第8页)页)(第(第3版教材第版教材第7页)页)回归模型的随机误差项中一般包括如下几项内容,回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,()非重要解释变量的省略,(2)人的随机行)人的随机行为,(为,(3)数学模型形式欠妥,()数学模型形式欠妥,(4)归并误差)归并误差(粮食的归并)(粮食的归并)(5)测量误差等。)测量误差等。回归模型存在两个特点。回归模型存在两个特点。(1)回归函数不能百分之百地再现所研究的经济过)回归函数不能百分之百地再现所研究的经济过程。程。(2)也正是由于这些假定与
3、抽象,才使我们能够透)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。过复杂的经济现象,深刻认识到该经济过程的本质。模型解释变量和误差项模型解释变量和误差项ut的的假定条件假定条件如下如下:(1)ut 是一个随机变量,是一个随机变量,ut 的取值服从概率分布。的取值服从概率分布。(2)E(ut)=0。(3)ui 具有同方差性。具有同方差性。D(ut)=Eut-E(ut)2=E(ut)2=2。(4)ut 为正态分布(根据中心极限定理)。为正态分布(根据中心极限定理)。以上以上四个假定条件四个假定条件可作如下表达。可作如下表达。ut N(0,)(第(第2版教材
4、第版教材第11页)页)(第(第3版教材第版教材第9页)页)模型解释变量和误差项模型解释变量和误差项ut的的假定条件假定条件如下如下:(5)ui 非自相关。非自相关。Cov(ui,uj)=E(ui-E(ui)(uj-E(uj)=E(ui,uj)=0,(i j)。(6)xi是非随机的。是非随机的。(7)ui 与与xi 相互独立。相互独立。Cov(ui,xi)=E(ui-E(ui)(xi-E(xi)=Eui(xi-E(xi)=Eui xi-ui E(xi)=E(ui xi)=0.(8)对于多元线性回归模型,解释变量之间不能完全对于多元线性回归模型,解释变量之间不能完全 相关或高度相关(非多重共线性)
5、。相关或高度相关(非多重共线性)。在假定(在假定(1),(),(2),(,(6)成立条件下有)成立条件下有 E(yt)=E(0+1 xt+ut)=0+1 xt(第(第2版教材第版教材第11页)页)(第(第3版教材第版教材第9页)页)2.最小二乘估计(OLS)通常通常真实的回归直线是观测不到的真实的回归直线是观测不到的。收集样本的目的就是。收集样本的目的就是要对这条真实的回归直线做出估计。要对这条真实的回归直线做出估计。(第(第2版教材第版教材第12页)页)(第(第3版教材第版教材第10页)页)(第(第2版教材第版教材第13页)页)(第(第3版教材第版教材第11页)页)(第(第2版教材第版教材第
6、14页)页)(第(第3版教材第版教材第13页)页)谁提出的谁提出的OLS估计方法?估计方法?(C F Gauss,1777-1855)C F Gauss 1809年提出年提出OLS估计方法估计方法。例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 OLS估计结果:估计结果:(第第2版版教材第教材第17页)页)(第第3版版教材第教材第15页)页)(file:li-2-1)3.OLS回归函数的性质回归函数的性质(第第2版版教材第教材第15页)页)(第第3版版教材第教材第13页)页)(第第2版版教材第教材第15页)页)(第第3版版教材第教材第13页)页)3.OLS回归函数的性质回归函数的性质(
7、第第2版版教材第教材第19页)页)(第第3版版教材第教材第18页)页)(3)最小方差性最小方差性 0,1的的OLS估计量的方差比其他估计量的方差小。估计量的方差比其他估计量的方差小。(第第2版版教材第教材第21页)页)(第第3版版教材第教材第19页)页)(第第2版版教材第教材第16页)页)(第第3版版教材第教材第14页)页)(第第2版版教材第教材第30页)页)(第第3版版教材第教材第27页)页)6 的估计的估计(第第2版版教材第教材第23页)页)(第第3版版教材第教材第28页)页)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 估计结果:估计结果:(第第2版版教材第教材第32页)页)(
8、第第3版版教材第教材第29页)页)(file:li-2-1)7拟合优度的测量拟合优度的测量 拟合优度是指回归直线对观测值的拟合程度。拟合优度是指回归直线对观测值的拟合程度。(第第2版版教材第教材第26页)页)(第第3版版教材第教材第24页)页)(第第2版版教材第教材第26页)页)(第第3版版教材第教材第24页)页)度量拟合优度的统计量:可决系数(确定系数)度量拟合优度的统计量:可决系数(确定系数)R2的取值范围是的取值范围是 0,1。对于一组数据,对于一组数据,TSS是不变的,所以是不变的,所以RSS(),ESS()。)。RSS:旧指回归平方和(:旧指回归平方和(regression sum
9、of squares),),现指残差平方和(现指残差平方和(sum of squared residuals)ESS:旧指残差平方和(:旧指残差平方和(error sum of squares(sum of squared errors)),),现指回归平方和(现指回归平方和(explained sum of squares)(第第2版版教材第教材第27页)页)(第第3版版教材第教材第25页)页)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 可决系数可决系数:(第第2版版教材第教材第28页)页)(第第3版版教材第教材第25页)页)(file:li-2-1)8回归参数的显著性检验回归参
10、数的显著性检验与置信区间与置信区间(第第2版版教材第教材第32页)页)(第第3版版教材第教材第29页)页)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 回归参数的显著性检验回归参数的显著性检验:H0:1=0;H1:1 0。在。在H0成立条件下,成立条件下,H0:0=0;H1:0 0。在。在H0成立条件下,成立条件下,Prob=P|t|t-Statistic|检验结果:检验结果:回归参数显著不为零。回归参数显著不为零。(第第2版版教材第教材第32页)页)(第第3版版教材第教材第29页)页)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 OLS估计表达式:估计表达式:(7.7)(
11、4.3)R2=0.67,DW=1.32,T=11,(,(1988 1998)(file:li-2-1)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 真实值真实值拟合值拟合值残差残差S.E.-S.E.分析残差的正态分布性分析残差的正态分布性(file:li-2-1)分析残差分析残差(第第2版版教材第教材第33页)页)(第第3版版教材第教材第30页)页)8回归参数的回归参数的显著性检验与显著性检验与置信区间置信区间 例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 1 1的置信区间:的置信区间:0 0的置信区间:的置信区间:(第第2版版教材第教材第34页)页)(第第3版版教材第教材
12、第31页)页)(file:li-2-1)8回归参数的回归参数的显著性检验与显著性检验与置信区间置信区间(第第2版版教材第教材第38页)页)(第第3版版教材第教材第34页)页)9yF 的点预测与区间预测的点预测与区间预测例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 9.yF 的点预测与区间预测的点预测与区间预测:(演示演示EViews操作操作)(第第2版版教材第教材第39页)页)(第第3版版教材第教材第36页)页)Y1999的点估计值的点估计值:Y1999=10.77+0.005069 1863=20.21Y2000的点估计值的点估计值:Y2000=10.77+0.005069 198
13、3=20.82(file:li-2-1)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 9.yF 的点预测的点预测与与区间预测区间预测Y1999的置信区间的置信区间:20.2089 2.26 1.4417 16.9507,23.4671Y2000的置信区间的置信区间:20.8171 2.26 1.5297 17.3600,24.2742(第第2版版教材第教材第39页)页)(第第3版版教材第教材第36页)页)Y1999的点估计值:的点估计值:Y1999=10.77+0.005069 1863=20.21Y2000的点估计值:的点估计值:Y2000=10.77+0.005069 1983=
14、20.82(file:li-2-1)教材教材2.8节节 案例分析案例分析 人均消费性支出与可支配收入关系人均消费性支出与可支配收入关系(第第2版版教材第教材第42页)页)(第第3版版教材第教材第39页)页)整个样本整个样本区间预测的区间预测的EViews操作操作(file:li-2-3)补充案例补充案例1:用回归模型预测木材剩余物用回归模型预测木材剩余物(file:case1file:case1)伊春林区位于黑龙江省东北部,有森林面积伊春林区位于黑龙江省东北部,有森林面积219万万公顷,木材蓄积量为公顷,木材蓄积量为2.3亿亿m3。森林覆盖率为。森林覆盖率为62.5%,是我国主要的木材工业基地
15、之一。,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为年伊春林区木材采伐量为532万万m3。按此速度。按此速度44年之后,年之后,1999年的蓄积量将被采伐一空。年的蓄积量将被采伐一空。为缓解森林资源危机,并解决部分职工就业问题,为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分除了做好木材的深加工外,还要充分利用木材剩利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。工生产的一个关键环节。黑龙江省伊春林区
16、 观测点近似服从线性关系。观测点近似服从线性关系。建立一元线性回归模型如下:建立一元线性回归模型如下:yt=0+1 xt+ut年剩余物年剩余物yt和年木材采伐量和年木材采伐量xt散点图散点图分析分析EViews输出结果。注意:输出结果。注意:S.D.和和s.e.的区别。的区别。s.e.和和SSE的关系。的关系。=-0.7629+0.4043 xt (-0.6)(12.1)R2=0.91,T=16上述模型的上述模型的经济解释经济解释是,对于是,对于伊春林区每采伐伊春林区每采伐1 m3木材,木材,将平均产生将平均产生0.4 m3的剩余物。的剩余物。问题问题3:为什么离群值对回归参数:为什么离群值对
17、回归参数OLS估计量的影响大?估计量的影响大?10.EViews操作操作附录附录1:怎样建立:怎样建立EViews新工作文件。新工作文件。附录附录2:怎样用:怎样用EViews通过键盘输入,复制、粘贴功能通过键盘输入,复制、粘贴功能 输入数据。输入数据。注意注意:(1)变量命名时,字符不得超过)变量命名时,字符不得超过16个。个。(2)给变量命名时,避免使用下列名字:)给变量命名时,避免使用下列名字:ABS,ACOS,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,P
18、DL,RESID,RND,SAR,SIN,SMA,SQR,THEN。附录附录3:OLS估计的操作步骤。估计的操作步骤。QuickEstimate Equation。对话框中输入对话框中输入 y c x。OK键。键。附录附录4:怎样用:怎样用EViews预测。预测。11相关系数相关系数相关(相关(correlation):指两个或两个以上变量间相互关系的:指两个或两个以上变量间相互关系的程度或强度。程度或强度。分类:分类:按强度分按强度分 完全相关完全相关:变量间存在函数关系。:变量间存在函数关系。高度相关高度相关(强相关):变量间近似存在函数关系。(强相关):变量间近似存在函数关系。弱相关弱相
19、关:变量间有关系但不明显。:变量间有关系但不明显。零相关零相关:变量间不存在任何关系。:变量间不存在任何关系。完全相关完全相关 高度相关、线性相关、正相关高度相关、线性相关、正相关 弱相关弱相关 (第第2版版教材第教材第28页)页)(第第3版版教材第教材第26页)页)按变量个数分按变量个数分简单相关:指两个变量间相关。简单相关:指两个变量间相关。按形式分:线性相关按形式分:线性相关,非线性相关非线性相关 按符号分:正相关按符号分:正相关,负相关负相关,零相关零相关复相关(多重相关和偏相关):复相关(多重相关和偏相关):指指3个或个或3个以上变量间的相关。个以上变量间的相关。11相关系数相关系数
20、 非线性相关非线性相关 负相关负相关 零相关零相关 11.2 简单线性相关的度量简单线性相关的度量 简单线性相关系数,简称相关系数(简单线性相关系数,简称相关系数(correlation coefficient)。度量两个变量间的线性相关强度,用度量两个变量间的线性相关强度,用 表示。表示。的随机变量表达式是的随机变量表达式是(第第2版版教材第教材第28页)页)(第第3版版教材第教材第26页)页)11.3 相关系数的取值范围相关系数的取值范围 图图1 正相关正相关 图图2 负相关负相关 图图3 r=0.92 图图4 r=0.99 散点图与相关系数散点图与相关系数 值的对应关系值的对应关系11.
21、4 线性相关系数的局限性线性相关系数的局限性(1)只适用于考察变量间的线性相关关系。变量不相关与变量相互独立在只适用于考察变量间的线性相关关系。变量不相关与变量相互独立在概念上是不同的。概念上是不同的。(2)相关系数的计算是一个数学过程相关系数的计算是一个数学过程,但不能揭示变量间关系的实质。但不能揭示变量间关系的实质。(3)一般说二变量相关时,可能属于如下一种关系。一般说二变量相关时,可能属于如下一种关系。单向因果关系单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。如施肥量与农作物产量;对金属的加热时间与温度值。双向因果关系双向因果关系。如工业生产与农业生产;商品供给量与商品价格。如工业生产与农业生产;商品供给量与商品价格。另有隐含因素影响二变量变化另有隐含因素影响二变量变化。虚假相关虚假相关。(1997-2001,file:5correlation1)13宗宗/分分 11.5 简单相关系数的检验简单相关系数的检验复习计量经济学基础表复习计量经济学基础表2.3 计算公式一览表。计算公式一览表。相关系数的相关系数的EViews操作:打开数据窗口。选操作:打开数据窗口。选View/Correlation(第第2版版教材第教材第41页)页)(第第3版版教材第教材第37页)页)(第第2版版教材第教材第29页)页)(第第3版版教材第教材第26页)页)第2章结束。