《计量经济模型与经济预测(1)evhk.pptx》由会员分享,可在线阅读,更多相关《计量经济模型与经济预测(1)evhk.pptx(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济模型与经济预测福州大学管理学院林筱文教授编一、线性回归模型 l 最小二方程原理和参数估计=a+bx y Q=(y-)最小=(y-a-bx)2 最小 对a和b 求一阶微分 2Q/2A=2(y-a-bx)(-a)=0 2Q/2B=2(y-a-bx)(-bx)=0 x得:y-na-b x=0 y=na+bx=0 xy-ax-bx2=0 xy=ax+bx2=0得:a=y/n-b(y/n)b=xy-(x)(y)/n/x2-(x)2=Lxy/Lxx回归系数b 说明当x变动一个单位时,y平均变动一个b 的值l 回归误差估计和相关系数估计标准误差:Sy=(y-)2/(n-2)=(y2-a y-b xy
2、)/n-2相关系数:R=Lxy/LxxLyy Lxy=xy-(x y)/n Lxx=x2-(x)2/n Lyy=y2-(y)2/n 线性回归模型预测 当计算回归模型由大样本计算时(n30),其预测区间的误差分布服从正态分布,则预测区间为:0=(a+bx0)(Z2/2)Sy 当计算回归模型由小样本计算时(n30),其预测区间的误差分布服从七分布,则预测区间为:0=(a+bx0)(Ta/2)Sy 1+1/n+(X0-X)2/(X-X)2l 例:建筑面积(万m2)x建造成本(万元)yx2y2xy y-(y-)24 14.8 16 219.04 59.2 14.582 0.218 0.0475242
3、12.8 4 163.84 25.6 12.586 0.214 0.0457963 13.3 9 176.89 39.6 13.588-0.084 0.0475245 15.4 25 237.16 77.0 15.580-0.180 0.0324004 14.3 16 204.49 57.2 14.582-0.282 0.0795245 15.9 25 252.81 79.5 15.580-0.320 0.010240 23 86.5 95 1254.23 338.4 86.49_0.181924l 解:b338.41/6(23)(86.5)/95-1/6(23)2=0.998 a 86.5/
4、6 0.998(23/6)=10.59待线性回归方程:10.59+0.998x 即建筑面程每增加一万m2,建造成本要平均增加0.998万元Sy=(y-)2/(n-2)=0.0181924/(6-2)=0.2133r=Lxy/LxxLyy=(xy-x y/n)/x2-(x)2/ny2-(y)2/n=0.973预测:假设x0=4.5时,y0=10.59+0.9984.5=15.081(万元),当n=630时,查七分布表ta/2(n-2)=t(0.025)(4)2.78ta/2(n-2)Sy 1+1/n+(x0-x)2/(x-x)2=0.6579所以建造成本的区间预测在显著性水平为a=5%,即以95
5、%的概率计算y0=15.0810.6579,即在14.423115.7389万元之间二、非线性回归模型曲线回归模型在对客观现象选择回归模型时,应注意:1、回归方程的形式应与经济学的基本理论相一致,应该在定性分析和定量分析的基础上选择适当的回归模型2、回归方程与实际现象的变量值应要有较高的拟合程度,能较好地反映经济实际运行趋势3、在对方程的模型一时无法判断时,可先画散点图,观察现象实际值的变动趋势,来选择相应的拟合回归模型。或者多选择几个回归模型,加以拟合,分别计算估计标准误差,选择估计标准误差最小的那个回归模型4、回归模型的数学形式要尽可能简单,一般说来,数字型式越简单,则基回归模型的可操作性
6、越强。过于复杂的回归模型的数学形式在实际经济分析和经济预测中,其实际应用价值不大抛物线方程:=a+bx+cx2根据最小二乘法原理,求该方程待定a、b、c参数的方程组如下:y=na+b x+c x2 y xy=a x+b x2+c x3 x2y=a x2+b x3+C x4 x判定某变量趋势是否符合抛物线议程时,可利用差分法:1、当X以一个常数变化时,Y的一阶差分即Y=Yt-Yt-1的绝对值也接近一个常数时,该变量的变化可用直线方程来拟合。2、当X从一个常数变化时,Y的二阶差分即Y2t=Yt-Yt-1的绝对值接近一个常数时,该变量的变化可用抛物线方程来拟合。抛物线方程 指数曲线方程l 该方程常用
7、于拟合某变量值的环比,即Yt/Yt-1的绝对值近似于一个常数时,就可用指数曲线方程来拟合。=abx对方程两边求对数:lgy=lga+lgbx换元令lgy=Y lga=A lgb=B得:Y=A+Bx,化成直线方程的形式,求出A、B的参数值,再分别求反对数,就可求出a、b的参数值,指数曲线因a、b的取值不同而表现出不同的变化形式:x x x x y y y y 对数函数曲线=a+blnx,令x=lnx,把方程变成直线方程的形式,求出a、b的参数值。对数函数的特点是随着x的增大,x的单位变动对Y的影响效果递减。S 函数曲线(逻辑曲线)=1/a+be-x y换元令y=1/y,x=e-x得y=a+bx
8、化成直线方程的形式 p可求出a、b 的参考值。该方程的特点是某变量刚开始时,随着X x的增加,y的增长速度逐渐增加,I II III IV当y达到一定水平时,其增长速度又放慢,最后超近于 一条渐近线。该方程经常用来描述某消费品的生命周期的变化,可将其分为四个阶段,即缓慢增长快速增长增速放慢相对饱和p 为一拐点。三、多元回归模型l 模型与参数估计=a+bx1+cx2+dx3+.多元回归就是分析在多个自变量(x)与因变量(y)相互关系的基础上,确定一个多元回归模型,然后根据各个自变量的变动来估计或预测因变量的变动程度。根据最小二乘法原理,以二元回归方程为例,说明求其参数的方法:=a+bx1+cx2
9、 y=na+bx1+cx2 x1y=ax1+bx12+c x1 x2 x2y=ax2+b x1 x2+cx22例:根据下表计算二元回归方程例:根据下表计算二元回归方程利润额 y销售额 x1流通费用 x2X1y X2y X1x2X12X22 124 500 350 62000 43400 175000 250000 122500 124.1142 480 315 68160 44730 151200 230400 99225 141.4132 520 360 68640 47520 187200 270400 129600 133.5134 515 355 69010 47570 182825
10、265225 126025 133.9147 525 351 77175 51597 184275 275625 123201 148.2140 532 367 74480 51384 195244 283024 134698 138.1149 550 374 81950 55726 205700 302500 139876 148.8 968 3622 2472 501415 341923 1281444 1877174 875116 968.0将上述有关数字代入二元回归的方程组:将上述有关数字代入二元回归的方程组:986=7a+3622b+2472c 501415=3622a+187717
11、4b+1281444c 341923=2472a+1281444b875116c得:a=-5.0657 b=1.0072 c=-1.0698二元回归方程:=-5.0657+1.0072x1-1.0698x2多元回归方程的矩阵形式多元回归方程的矩阵形式二元回归方程的矩阵形式表现为:Y=XB其中:y1 1 x21 xk1 b1 y2 1 x22 xk2 b2 Y=X=B=yn 1 x2n xkn bn按矩阵计算原理:Y=XBXY=XXB(XX)-1XY=(XX)-1(XX)BB=(XX)-1XY例:下表列出某商品销售量(例:下表列出某商品销售量(YY)与居民人均收入)与居民人均收入(xx11)和单
12、价()和单价(xx22)的有关资料。)的有关资料。年 份1 2 3 4 5 6 7 8 9 10销售量(y百件)10 10 15 13 14 20 18 24 19 23居民人均收入(x1百元)5 7 8 9 9 10 10 12 13 15单价(x1十元)2 3 2 5 4 3 4 3 5 4上表中有关数据的矩阵表示为:上表中有关数据的矩阵表示为:1 5 2 10 b1 10 98 35 X=1 7 3 Y=10 B=b2(xx)=98 1038 359 35 359 133 1 15 4 23 b3 166 1.6416-0.0839-0.2054(xy)=1743(xx)-1=-0.08
13、39 0.0188-0.0286 592-0.2054-0.0286 0.1389 1.6416-0.0839-0.2054 166 4.58751B=(xx)-1xy=-0.0839 0.0188-0.0286 1743=1.86847-0.2054-0.0286 0.1389 592-1.79957由此得多元回归方程为:=4.58751+1.86847x1-1.79957x2 回归方程的方差估计Sy2=(y-)2/(n-k)=e2/(n-k)e2=ee=YY-BXY=2980-4.58751166-1.86847 1743+1.79957+1.79957 592=27.08 e2 27.0
14、8S=S2=n-k=10-3=3.8686=1.97S称为回归方程的估计标准误差,S越小 则表明样本回归方程的代表性越强 多元回归方程的检验根据线性方程方差分析的原理:(y-y)2=(-y)2+(y-)2(y-)(y-y)S总=S回+S残(-y)y1.回归方程拟合程度检验在回归方程拟合程度检验中,应用可决系数指标来回加以检验,可决系数越大,说明回归方程对实际数值的拟合程度越好R2=(-y)2/(y-y)2=S回/S总=1-S残/S总在考虑变量自由度的情况下,修正的可决系数:R2=S回/(n-k)/S总/(n-1)=1-S残/(n-k)/S总/(n-1)=1-27.08/(10-3)/244.4
15、/(10-1)=0.842.2.回归系数的显著性检验 回归系数的显著性检验在这一检验的目的是为了检验各回归系数对应的自变量(x i)对因变量(y)的影响是否显著,以便对各个自变量的选择作出正确的判断。一般说来,当某个自变量(x i)的回归系数(b i)的显著性检验无法通过,则说明该自变量对因变量的影响在一定显著水平(一般 a=0.05)不够显著,则就可以将该自变量从回归模型中删除,这样才能以尽可能少的自变量去建立回归模型,达到到尽可能高的拟合度,同时也可减少计算工作量多元回归模型中的回归系数检验采用t检验,公式如下:tbj=bj/sbj sbj=sy2jj=sy jj式中jj为(xx)-1矩阵
16、中的第j个对角线的元素,上例中Sy=1.97;11=1.6416;22=0.0188;33=0.1389则tb1=4.5875/(1.97 1.6416)=1.82 tb2=1.8685/(1.97 0.0188)=6.92 tb3=-1.7996/(1.97 0.1398)=-2.45查t分布表(a=0.05),双侧临界值t(a/2)(n-k)=t(0.05/2)(10-3)=2.365,上述tb2=6.922.365,tb3=-2.45 2.365,说明b1和b2均能通过检验,说明x1和x2对y的影响是显著的,而tb1=1.822.365,不能通过检验,说明在建立回归方程时,不必设常数项,
17、由此再根据实际资料,建立拟合的多元回归方程。3.回归方程的显著性检验该检验应用下检验来进行:F=S回/(k-1)S残/(n-k),上例中S总=224.4,S残=27.08S回=S总-S残=224.4-27.08=197.32则F=197.32/(3-1)/27.08(10-3)=25.50查F分布表,当a=0.01,自由度为(2.7)时,F2=9.55,当a=0.05,自由度为(2.7)时,Fa=4.74,可知F=25.50都大于Fa,说明该多元回归方程是比较显著的,可以用该方程进行经济预测。设x1=2200元,x2=50元/件时,对某商品需求量(y)的预测值为y=4.5875+1.86852
18、2+(-1.7996)5=36.70(百件)多元回归方程的多重共线性问题多元回归方程的多重共线性问题在多元回归模型中,要求模型中任何自变量之间不存在密切的线性相关关系存在,则说明自变量之间存在多重共线性。1.多重共线性产生的经济背景和原因当人们进行多元回归分析时,涉及的自变量较多,一时很难确定究竟要用哪个自变量来建立多元回归方程,也很难找到一组互不相关而都对因变量有显著影响的自变量,严格地讲,当某一经济现象的变量涉及多个自变量影响因素时,这些自变量的因素大都共有一定的线性相关关系,当其中的某些自变量两两相关关系较强时,就可认为该回归方程存在多重共线性。当人们所研究的问题涉及到时间序列资料时,由
19、于所涉及到的自变量往往随着时间变化(或共同的政策倾向)而表现出共同的变化趋势,从而产生共线性现象。例如人们在研究社会消费水平时,所涉及的影响因素有社会人均GDP水平,城镇居民收入水平,农民平均收入水平,银行储蓄存款余额,消费价格指数等指标,而这些指标之间都可能存在着很强的相关关系,如果从这些指标作为多元回归模型的自变量,该回归模型就存在着多重共线性。对于利用横截面资料建立多元回归模型,也可能存在自变量之间高度相关的问题。例如应用横截面资料建立粮食产量模型,其自变量有农业投资;化肥投入,水利灌溉面积等。其实农业投资已在化肥投入和水利灌溉面积中体现出来了,它们之间存在较强的相关关系,而表现出共线性
20、问题。2.多重共线性带来的问题:当回归模型从矩阵形式表示时y=XB,当存在自变量之间的完全多衙共线性时,存在 xx=0,xx-1也不存在,矩阵的行列式计算等于0,则B=(xx)-1xy也无法计算。在实际生活中,经常见到的是自变量之间存在近似共线性情况,即 xx 0,xx 1的对角线元素较大,从而使得方程估计的精度下降,甚至出现 回归系数的经济意义无法解释的可能。3.多重共线性的判断多种共线有各种判断方法,这里举一个简单的判断方法:设自变量有x1、x2、x3、xp,其回归方程为:y=f(x1、x2、x3、xp),如果这多个自变量中两两自变量(xj)之间存在相关系数很大,则说明这个回归方程可能存在
21、多重共线性问题,这时就要剔除其中的一个自变量或把这两个自变量相加,以求得计算过程的简化。4.对多重共线性问题的消除方法常用的消除多重共线方法有:(1)剔除一些不重要的解释变量,或对某些变量进行合并。(2)增大样本容量。在实际经济问题的多元回归分析中,如果所搜集的样本数据太少,也容易产生多重共线性问题。(3)改变变量的定义形式。对于某些样本变量数据是时间序列资料时,因各变量往往随着时间的变化向表现出共同的变化趋势,回归方程存在多种共线性,此时,对变量彩差分法重新定义,可能取得较好的效果。例如,建立的多元回归方程y=a+bx1+cx2+dx3+ex4,其中当各自量之间可能出现两两变量高度相关出现多
22、重共寿终正寝性问题,则令:y=yi-yi-1x1=x1i-x1(i-1)x2=x2i-x2(i-1)x3=x3i-x3(i-1)x4=x4i-x4(i-1)y=a+b x1+c x2+d x3+e x4,然后去估计回归参数(4)利用已知的信息,进行变量之间的替换。(1)准则在解决了多重共线性问题之后,多元回归方程的自变量选择应当使所拟合的回归方程的可决系数达到最大R2=(-y)2/(-y)2=S回/S总=1-S残/S总残差平方程达到最小,Sy2=(y-)2/n-p-1对回归系数的检验,若该回归系数不能通过显著性检验,就剔除该自变量,然后重新建立一个新的回归方程,然后再进行显著性水平检验。(2)
23、逐步回归的方法当建立一个多元回归方程时,由于人们事先不知道哪些变量来作为自变量,往往凭经验或定性分析多选择几个自变量建立多元回归模型,然后逐步对方程进行显著性检验,逐步剔除退出或变换增加某个自变量,如此反进行,最后使得整个方程的所有检验都可以通过为止。多元回归方法自变量的选择和逐步回归的方法多元回归方法自变量的选择和逐步回归的方法四.多元回归模型的应用l 虚拟变量的应用在回归模型分析中经常发生:因变量(y)不仅受诸如产量、价格、成本、身高、温度等可测量的数量变量的影响,而且也受到诸如:性别、文化程度、种族、宗教信仰、战争、地震、季节等及政府政策变化等品质变量的影响;因此,在建立回归方程时,不仅
24、要引入数量变量,也要引入质量变量。当某种品质变量以是(1)非(0)表示时,就称其为虚拟变量。常见的虚拟变量的回归模型有以下三种表现形式:1.反映政府政策发生重大变化或其他因素发生重大变异的跳跃式,间断式的回归模型,其模型的形式为:=1+2xi1+3Di Di=0 ii0 1 i i0图示:y x Xi0如果上图由一条址线回归方程来拟合,就会出现较大的误差 2.具有某种转折点的系统趋势的变化模型,其模型的形式为:=1+2xi1+3(xi1-xi0)Di Di=0 ii0 1 i i0i0=为发生转折的年份图示:Xi0显然如果上图由一条曲线方程来拟合,就会出现较的误差3.含有多个虚拟变量的因归模型
25、。根据品质变量的不同特征和回归模型的需要,可以引入多个虚拟变量来表示多次转折、跳跃和间断的情况。例如建立个人医疗保障年支出回归模型:i=1+2xi1+3Di 1+4Di 2式中xi1为个人收入额 1 文化程度为大专及以上Di 1 0 其它 1 机关及行政事业单位Di 2 0 其它例如:为研究美国住房面积的需求,选用3120户家庭为建模样本,回归模型为logQ=1+2 P+3 logY其中:Q 3120个样本家庭的年住房面积(平方英尺)P 家庭所在地的住房单位价格 Y 家庭收入经计算:logy=4.17-0.247log P+0.96logy R2=0.371(0.11)(0.017)(0.02
26、6)上式中2=0.247的价格弹性系数,3=0.96的收入弹性系数,均符合经济学的常识,即价格上升,住房需求下降,收入上升,住房需求也上升。但白人家庭与黑人家庭对住房的需求是不一样的,引进虚拟变量D:1 黑人家庭Di 1 0 白人家庭或其它家庭logQ=1+X1D+2 log P+a2D log P+3log Y+a3D log Y例:某省农业资料购买力和农民倾向收入数据如下:例:某省农业资料购买力和农民倾向收入数据如下:年份 农资购买力(yi)农民倾向收入(xi)Di1975 1.3 4.7 01976 1.3 5.4 01977 1.4 5.5 01978 1.5 6.9 01979 1.
27、8 9.0 11980 2.1 10.0 11981 2.3 11.3 11982 2.6 13.4 11983 2.7 15.2 11984 3.0 19.3 11985 3.2 27.8 1解:根据上述数据建立一元线性回归方程=1.0161+0.09357xR2=0.8821 Sy=0.2531 F=67.3266 带虚拟变量的回归模型,因1979年中国农村政策发生重大变化,引入虚拟变量来反映农村政策的变化 0 i1979年 Di=1 i 1979年建立回归方程为:=0.9855+0.0692x+0.4945D(9.2409)(6.3997)(3.2853)R2=0.9498 Sy=0.1
28、751 F=75.6895虽然上述两个模型都可通过显著性水平检验,但可明显产生带虚拟变量的回归模型的可决系数更高,回归的估计误差(Sy)更小,说明模型的拟合程度更高,代表性更好。分段回归法的应用对有些经济现象的波动带有明显的阶段性,这时为提高回归方程的拟合效果,可彩分段回归的方法来建立回归方程。阶段性转折点的确定可以用散点图来观察确定 y x x0 x1 1+2xt 0 x1五.异方差与序列相关l 异方差1.回归分析的假定性和异方差回归分析的一个基本假定就是回归模型中随机误差项单位:千万元 单位:千万元商店 销售收入(x)利润总额(y)因归估计值()残差(e=y-)1 160.0 12.8 1
29、0.2 2.62 151.8 8.9 9.6-0.73 108.1 4.1 6.7-2.44 102.8 2.8 6.3-3.55 89.3 8.4 5.4 3.06 68.7 4.3 4.1 0.27 66.8 4.0 3.9 0.18 56.2 4.5 3.2 1.39 55.7 3.1 3.2-0.110 53.0 2.3 3.0-0.7接上表 接上表 单位:千万元 单位:千万元商店 销售收入(x)利润总额(y)因归估计值()残差(e=y-)11 49.3 4.1 2.8 1.312 43.0 2.0 2.4-0.413 42.9 1.3 2.3-1.014 37.6 1.8 2.0-0
30、.215 29.0 1.8 1.4 0.416 27.4 1.4 1.3 0.117 26.2 2.0 1.2 0.818 22.4 0.9 1.0-0.119 22.2 1.0 1.0 020 20.7 0.5 0.9-0.4根据最小二乘法计算出来的回归模型和回归估计值,然后再计算残差。从参数估计可看出该回归模型可决系数较高,一有关参数可能性通过检验,直观上认为该模型可作为预测所用。但若从残差值(e=y-)做座标图分析,可看出:从坐标图上看,残差的波动基本上呈一个喇叭型状态,销售收入小的单位,其残差一般较小,销售收入大的单位,其残差一般也较大,即残差随着商店规模扩大,销售额的增加而扩大。这表
31、明,不同销信规模的商店,其利润总额的方差各不相同,由于回归模型中随机误差的方差不是一个常数,这里就存在着异方差的现象。这种现象经常出现在以横截面数拓建立的回归模型分析中,对时间序列数据有时也会出现异方差性,例如对某公司的C-D生产函数的估计,因不同时期的数据内涵标准不同,企业的投资水平,管理水平等不同,也会发生异方差性现象。2.回归模型存在异方差的后果参数的最小二乘法估计虽然是元偏的,但却是非有效的。参数估计量的方差是有偏的,这将导致参数的假设检验也是非有效的。3.异方差性的检验判断(1)残差图分析法 e一般情况下,对随机数据所做的回归分析,当回归模型满足所有的假定时,残差图上的点是随机分布的
32、,无任何规律,如上图所示。如图回归模型存在异方差性,残差图上的点出现相应的有规律性的趋势,即随着y的增大,而出现e随之增大或减少的趋势,如下图:(2)等级相关系数法斯皮而曼检验这种检验既可以用大样本,也可以用小样本进行检验。其步骤如下:第一步:作回归方程=a+bx,并求e=y-第二步:取e的绝对值,并与x按递增或递减顺序排成等级,然后计算相关系数。r e x=(1-6d2)/n(n2-1)式中n为样本容量,d为相应的x与e的等级差数。第三步:检验,设H0:r=0l;H1:r0统计量为:t=r/1-r2 ta/2(n-2)当t ta/2(n-2)时,接受H0,可认为异方差性不存在,否刚就接受H1
33、,认为x与 ei 之间存在系统关系,异方差性存在。在多元线性回归模型中,对任一变量xj做等级相关检验,若不通过检验,则认为整个回归模型存在异方差性。(3)样本分段比较法检验戈德菲尔德匡特检验该检验法的步骤是:将样本按某个解释变量的大小顺序排列,并将其分为两段;然后分别用最小平方法拟合两个回归模型,并分别计算各段的残差平方和S残1和S残2,计算高段的样本单位n1和低段的样本单位n2;计算各段模型随机误差的残差平方和,1=S残1(n1-k-1),2=S残1(n2-k-1);由此构造F统计量F=1/a2,该统计量服从第一自由度(n2-k-1)的F分布,在给定的显著性水平(a)下,进行Fa检验,若FF
34、a,刚认为该组数据存在异方差例如用前述某城市20家商店的销售额,分为5亿元以上的10家商店和5亿元以下的10家商店,分别用最小二乘法拟保两段的回归方程得:1=-0.75190+0.06875x,R2=0.6354(1.1845)(0.0184)1=4.70372=-0.63129+0.07207x,R2=0.5623(0.7535)(0.6225)2=0.4801F=12/22=4.7037/0.4801=9.7973 查第一自由度和第二自由度均为8,d=0.01时Fa=F(0.01)=6.03,即FFa,即认为存在异方差。存在异方差情况下的参数估计由于异方差存在时用普通最小二乘法对参数旱进行
35、估计的非有效性,这时回归模型的参数估计就不宜直接采用普通紧小二乘法进行参数估计,这时通常采用加权最小二乘法进行参数估计。对一元回归方程一种解的做法是用 xi 去除模型的两边各项。y/x=(a/x+bx/x=a/x+b x 还有一种方法是先用普通最小二乘法求出回归模型参数a和b,得回归方程=a+bx),然后用(a+bx)去除模型的两边各项,计算y/(a+bx)对1/(a+bx)和x/(x+bx)的无常数项的回归方程,这种方法称为二阶段加权最小二乘法 序列相关1.序号相关的概念 对时间序列资料,往往由于经济经济发展,某一时间的变量值对未来某一时间的变量值的影响就产生了序列相关。例如以前所提到的一元
36、回归方程=a+bx,x为自烃量,y为因变量。而在离列相关时,所建立的回归方程为t=a+byt-i,这时同是一个变量y,但yt-i为自变量。例如美国的轿车一般折旧期为3年,则前三年的轿车销售量往往会对后三年的轿车销售量发生影响,这时建立的序列相关回归模型为:t=a+byt-3。当然在=a+bx的方程中,也会存在序列相关的问题。在有的统计学课本中,所序列相关回归称为自相关,因回归,即自身的变量对滞后时期的本变量发生影响。某城市历年的某城市历年的GDPGDP和消费表和消费表 单位:亿元 单位:亿元年份GDP Xt总消费 yt回归值 t残差Et=yt-t197819791980198119821983
37、1984198519861987198819891990108.84120.11139.07139.15154.94183.13216.61257.12284.86326.82410.22455.96500.7240.9849.3457.4463.7271.2281.3196.14112.30125.16147.87178.49197.67230.9656.0760.1466.9967.0172.7282.8994.98109.61119.63134.78164.89181.41197.57-15.09-10.80-9.55-3.29-1.50-1.581.162.695.5313.0913.
38、6016.2633.36接上表 接上表 单位:亿元 单位:亿元年份GDP Xt总消费 yt回归值 t残差Et=yt-t199119921993199419951996598.79709.00863.231084.331395.121616.03225.47262.97310.28396.29506.58617.85232.98272.78328.47408.30520.52600.29-7.519.81-18.19-12.01-13.9417.56根据上述数据建立的回归方程为:=16.769+0.361x R2=0.99285 et2=3354.2986(4.9374)(0.0074)DW=/
39、=3217.2167/3354.2986=0.961715,否则很难做出正确判断l 序列相关情形下的参数估计当模型存在一阶序列相关时,对参数估计采用的有一阶差方法和方义差分法及选代法等几种。这里年份简单的一阶差分法。令:yt=yt yt-1 xt=xt-xt-1,则一阶差分回归模型=a+b x,然后用普通最小二乘法估计其参数。例如对上述某城市资料无截距(常数)项的一元回归模型,得:yt=0.3756 xt,R2=0.8495.S残=3166.3395(0.0269)l 在什么情况可能产生序列自相关现象(1)遗漏某些关键变量时可能产生序列自相关。例如,研究居民消费水平时,漏掉居民可支配收入的有关
40、数据变量,则用居民消费水平数据建立的回归模型可能产生正自相关。(2)经济变量的滞后性会带来序列自相关。例如前述美国轿车一般三年更新的例子。(3)采用错误的回归方式也可能引起。(4)经济上的蛛网现象可能引起。(5)对数据的错误加工可能导致误差项的自相关,例如,在季节性时间序列资料建立模型中,我们要常常消除季节性影响,对数据进行修匀处理后,可能会导致序列自相关。时间序列模型与预测时间序列模型与预测(一)简单外推模型。1、简单外推模型。(1)对一元回归时间序列线性模型。y=a+bt,按模型趋势发展时,令时间增长到t0,则y0=a+bt0 Sy=对大样本数据(n30),区间预测为y0=(a+bt0)土
41、Z Sy,区间为一平行线外推。对小样本数据(n30),区间预测为y0=(a+bt0)土t Sy,这时区间为一双曲线。(2)抛物线模型(2 2)抛物线模型)抛物线模型一阶:y=a+bt+ct2 二阶:y=a+bt+ct2+dt3 y y t t 一阶抛物线 二阶抛物线(3)(3)修正指数曲线模型 修正指数曲线模型y=k+abt对修正指数曲线模型的参数估计:三和法第一段:把序列(y)分为三段,每段都包括相等的几个数据,然后对各段求和,得各数:y 第二段:=nk+abn第三段:=nk+ab2n 令(2)-(1)得令(3)-(2)得令(5)(4)得:bn=b=(4)得:a=(1)得:k=某城市某产品修
42、正指数曲线模型计算表 某城市某产品修正指数曲线模型计算表 单位:万台 单位:万台 t销售量(yt)一阶差分一阶差分环比(%)yt1234.604.905.140.300.24 80.0014.64 4.60314.89975.13734565.335.485.600.190.150.1279.1778.9480.0016.41 5.32775.48015.60237895.705.785.840.100.080.0683.3380.0075.0017.32 5.70025.77865.8418上述时间序列数据的一阶差分得环比大致为一常数,故拟合修正指数曲线模型。b=0.8011 a=(16.4
43、1-14.64)=-1.4912K=1/314.64-(-1.4912)*(0.08113-1)/(0.8011-1)=6.0913 k=修正指数曲线模型:=6.0913+(-1.4912)(0.8011)t第9年 t=9时的预测 y9=6.0913+(-1.4912)(0.8011)=5.8917(万台)第10年 t=10时的预测 y10=6.0913+(-1.4912)(0.8011)=5.9320(万台)(4)S曲线模型成长曲线模型A.龚析兹曲线模型=对该模型两边对对数得lg=lgk+(lga)*bt(1)令y=lgy k=lgk A=lga 代入方程(1)得:Y=K+A*bt,该模型为
44、修正指数曲线模型,仿上例可求出有关参数后再求反对数可求出参数k,a,b的值b.逻辑斯特曲线模型=对该方程求倒数=k+abt,这时方程表现为修正龚柏兹曲线与逻辑斯特曲线的图形区别:S曲线的特征可分为三个阶段,经常用来对某个产品的生命周期或人口的增长状况进行描述和预测。它的第一阶段为萌芽期,第二阶段为增长期,在拐点的左边为边际递增,拐点的右边为边际递减,第三阶段为饱和期,曲线对拐点而言是旋转的对称。移动平均模型预测移动平均模型预测移动平均法是根据时间序列资料,逐项推移,依次计算移动平均,来反映现象的变动趋势时,运用移动平均法,消除这些因素的影响,进行动态数据的修匀,以利于旱灾行长期趋势的分析和预测
45、。(1)简单移动平均某产品月份销售量移动平均预测表 某产品月份销售量移动平均预测表 单位:只 单位:只t yt三项移动平均 五项移动平均12345678910111242335843444552742942650248038442744640541246946746145246945643043743945246647344444413 419 452对三项移动平均:M4=(y3+y2+y1)/3=(434+358+423)/3=405M5=(y4+y3+y2)/3=(445+434+358)/3=412以下类推对五项加权平均:M6=(y5+y4+y3+y2+y1)/5=(527+445+43
46、4+358+423)/5=437M6=(y6+y5+y4+y3+y2)/5=(429+527+445+434+358)/5=439以下类推对移动时间长度的选择,上述分别取三项移动平均和五项移动平均,得出t=13时的预测值分别为419只和452只。但究竟应该取几项移动平均呢?有效的办法是多取几个N,计算其移动平均值,然后分别求其均方误差。MSE=(-y)2/n,然后选取MSE较小的那个N,作为预测时的移动平均的时间长度。从上例中可看出:当N=3时,MSE=(1/9)*(-y)2=28893/9=3210.33当N=5时,MSE=(1/7)*(-y)2=11143/7=1591.86由此可见,当N
47、=5时,MSE较小,选择N=5,t=13时预测M13=452只。如果时间序列数字变化较大,用简单移动平均法就会产生较大的偏差。(2 2)加权移动平均法)加权移动平均法 近大远小原则的应用 近大远小原则的应用在简单移动平均公式中,第一个数据在计算中的作用是相同的。在简单移动平均公式中,第一个数据在计算中的作用是相同的。加权移动平均则对近期的数据认为更重要而给予更多的权数。如 加权移动平均则对近期的数据认为更重要而给予更多的权数。如下列:下列:t yt三项加权移动平均()相对误差(%)123456789106.356.206.226.667.157.898.728.949.289.806.246.
48、446.837.448.188.699.076.319.9314.4314.688.506.367.45对表中所列出的(yt)作出预测:4=M4=(6.22*3+6.20*2+6.35*1)/(3+2+1)=6.245=M5=(6.60*3+6.22*2+6.20*1)/(3+2+1)=6.44.10=M10=(9.28*3+8.94*2+8.72*1)/(3+2+1)=9.0711=M11=(9.80*3+9.28*2+8.94*1)/(3+2+1)=9.48相对误差=(6.66-6.24)/6.66=6.31%,以此类推上表中,总的相对误差为:1-(t/yt)*100%=1-(52.89/
49、58.44)*100%=9.50%则经过相对误差后的u=9.48*1/(1-9.5%)=10.48(万吨)(3)趋势移动平均法当现象出现线性增加或减少的趋势时,用简单移动平均或加权移动平均法来预测,就会出现滞后偏差,对此作出的修正的方法是二次移动平均,利用移动平均滞后偏差的规律建立线性方程,作出预测趋势移动平均的线性模型:t+T=at+btT式中:at=2 Mt(1)-Mt(2)bt=2/(N-1)(Mt(1)-Mt(2)对下表取N=6,分别计算Mt(1)和Mt(2)列于下表M21(1)=(4107+3770+3514+3277+3093+3006)/6=3461.2 M21(2)=(3461
50、.2+3246.7+3046.0+2832.7+2625.0+2435.8)/6=2941.2由公式得:a21=2 Mt(1)-Mt(2)=2*3461.2-2941.2=3981.2b21=2/(6-1)(Mt(1)-Mt(2)=(2/5)(3461.2-2941.2)=208得直线趋势模型 t+T=3981.2+208T 当t+T=22时,T=1 得:22=3981.2+208*1=4189.2(亿度)23=3981.2+208*2=4397.2(亿度)某时闪电某地区发电量一次二次移动平均计算 某时闪电某地区发电量一次二次移动平均计算 单位:亿度 单位:亿度t yt一次性移动平均Mt(1)