《《经济管理定量分析高级方法》实验指导书演示教学.doc》由会员分享,可在线阅读,更多相关《《经济管理定量分析高级方法》实验指导书演示教学.doc(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Good is good, but better carries it.精益求精,善益求善。经济管理定量分析高级方法实验指导书-经济管理定量分析高级方法实验指导书康继军编重庆大学经济与工商管理学院2007年7月目录实验1非线性回归模型估计(2)实验2工具变量估计与虚拟变量应用(9)实验3模型诊断与检验方法(15)实验4时间序列估计实验(22)实验1非线性回归模型估计实验一、实验目的通过本次实验,学会使用两种非线性回归模型的估计方法:(1)通过线性化的方式估计非线性回归模型;(2)直接估计非线性回归模型。二、实验安排1学时:本实验安排4个学时,主要用于完成实验及实验报告。2时间:由实验室统一安排
2、3地点:由实验室统一安排三、实验原理、内容、方法和步骤:(1)实验要求1通过实例演示,学会使用两种非线性回归模型的估计方法;2熟悉使用EVIEWS软件进行非线性回归模型估计的操作方法;(2)实验内容某硫酸厂生产的硫酸的透明度指标一直达不到优质的要求,经过分析透明度低与硫酸中的金属杂质含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47组样本值,数据如表11,硫酸透明度(y)与铁杂质含量(x)的散点图如图11,应该建立非线性回归模型。表11硫酸透明度(y)与铁杂质含量(x)数据序数yx序数yx序数yx1190311750523
3、340742190321860533425763180341944543530794140352054543625855150362148563716876120372250563816897110392356583920998814024525840207691004225506041201001080422641604220100111104327526143151101280432834634415110136848294064452712214804930256546201541550503130694720210167052322074图12硫酸透明度(y)与铁杂质含量(x)散点图1
4、通过线性化的方式估计非线性回归模型先建立倒数模型。首先建立工作文件。从工作文件主菜单中点击Quick键,选择EstimateEquation功能,在弹出的对话框的EquationSpecification(方程设定)选择框输入1/yc1/x点击OK键,得到估计结果如图12,对应的表达式是:1/Y=0.06927695796-2.372132322*1/Xt-value(18.6)*(-11.9)*R2=0.76,s.e.=0.009,F=143可决系数R2=0.76。图12实际上,如果建立指数函数,拟合的效果会更好。打开方程设定(Equationspecification)对话框,输入估计命令
5、,log(y)c1/x点击OK键,得到估计结果如图13,对应的表达式是:LOG(Y)=1.993732697+104.5194751*(1/X)t-value(21.97)*(21.64)*R2=0.91,s.e.=0.22,F=468,把表达式还原为指数形式,Lny=Ln(7.33)+104.5(1/x)式(1.1)y=7.33e105.5(1/x)可决系数R2由0.76提高到0.91,可见拟合为指数函数比倒数函数效果好。图13散点图与拟合的指数曲线见图14.图14EViews的操作步骤是,打开x,y数据组窗口,点击View键,选Graph/Scatter/ScatterwithRegres
6、sion功能(见图15).图15在随后弹出的对话框中y和x选对数和倒数形式(如图16),点击OK,就得到了图14.图16注意,对数变量和倒数变量也可以通过生成新序列的方式定义新的变量,然后用新变量进行估计,回归结果是一样的,例如把对数变量log(y)定义成Lny,倒数变量1x定义为z,这样估计命令为:Lnycz这一估计命令不如原估计命令“log(y)c1/x”好,因为在预测时,前者只能得到Lny的预测值,而后者即可以得到Lny的预测值,也可以得到y的预测值,而我们通常更关心y的预测结果。2直接估计非线性回归模型EViews的估计方法是直接书写非线性形式的命令,操作步骤如下。从工作文件的主菜单从
7、工作文件主菜单中点击Quick键,选择EstimateEquation功能,在弹出的对话框的EquationSpecification(方程设定)选择框输入指数形式的估计命令:Y=c(1)*EXP(C(2)*(1/X)如图17所示。其中C(1)、C(2)表示被估参数,EXP(.)表示指数函数形式。图17在Method(估计方法)对话框内默认的选择就是LSLeastSquares(NLSandARMA),其中NLS表示非线性最小二乘估计,即直接采用非线性函数回归形式估计参数。点击OK键,输出结果如图18.图18对应的非线性估计结果是:式(1.2)式(1.2)比式(1.1)的估计结果更好,因为可决
8、系数R2由0.91提高到0.96。当x=82时,y的预测值为28.11.实验2工具变量估计与虚拟变量应用实验一、实验目的通过本次实验,掌握工具变量估计方法和虚拟变量的应用方法。二、实验安排1学时:本实验安排4个学时,主要用于完成实验及实验报告。2时间:由实验室统一安排3地点:由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,学会使用工具变量估计方法和虚拟变量的应用方法;2熟悉使用EVIEWS软件进行工具变量估计和虚拟变量应用的操作方法;(2)实验内容参照下面的实验方法和步骤,进行工具变量估计和虚拟变量的应用操作,并得出结果。(3)实验方法和步骤1. 工具变量估计:19
9、781998年中国国内生产总值GDPt、宏观消费CONSt、资本形成总额CAPIt数据见表21.表21GDPt、CONSt、CAPIt数据(单位:亿元)年份国内生产总值宏观消费资本形成总额年份国内生产总值宏观消费资本形成总额yearGDPtCONStCAPItyearGDPtCONStCAPIt19783605.52239.11377.919891646610556.5609519794073.92619.41474.2199018319.511365.2644419804551.32976.11590199121280.413145.9751719814901.43309.115811992
10、25863.615952.1963619825489.23637.91760.2199334500.620182.11499819836076.34020.52005199447110.927216.219260.619847164.34694.52468.6199558510.5336352387719858792.157733386199668330.440003.926867.2198610132.865423846199774894.343579.428457.61987117847451.24322199879853.346405.9303961988147049360.15495建
11、立宏观消费模型:得到估计结果如下:模型中宏观消费CONSt是随机变量。因为CONSt是国内生产总值GDPt的一部分,所以GDPt也应该是随机变量,这就违反了模型中解释变量非随机的假定。而且GDPt也必然与ut高度相关,估计结果还显示模型存在严重的自相关,所以应该选择一个工具变量设法替代变量GDPt。资本形成总额CAPIt是GDPt的一部分,与GDPt高度相关。经过计算,以上模型的残差与CAPIt的相关系数为-0.03,这在一定程度上说明了CAPIt与ut不相关。基于上述理由,选择CAPIt做GDPt的工具变量。具体操作方法:从EViews主菜单中点击Quick键,并选择EstimateEqua
12、tion功能,打开EquationSpecification(模型设定)对话框。点击Method窗口,选择TSLS(两阶段最小二乘)估计方法,如图21.图21点击OK键,从而打开如图22的对话框,在EquationSpecification选择区输入命令:conscgdp其中cons表示CONSt,c表示截距项,gdp表示GDPt。在Instrumentlist(列写工具变量)选择区输入命令:ccpi表示用CAPIt和c(截距项)做工具变量(c可以省略不写,EViews程序会自动加入)。点击OK键,得到结果如图23.图22图232. 因此相应的回归式是:630.2961和0.5726分别是和的
13、工具变量法估计值。虚拟变量的应用:1982:11985:4中国季度酒销量(yt,万吨)数据如表22,序列见图24.这是一个季度时间序列数据,呈明显的季节变化特征,建立模型时应该加入季节虚拟变量以反映季节特征。表22全国酒销量(yt,万吨)季度数据时间ytD1时间ytD11982Q192.711984Q1107.911982Q279.301984Q296.701982Q380.101984Q397.801982Q486.701984Q493.601983Q1104.111985Q1111.511983Q289.701985Q298.401983Q390.201985Q397.701983Q490
14、.201985Q4940图2-4EViews中有专门定义季节虚拟变量的命令,操作如下:从工作文件主菜单中点击Quick键,选GenerateSeries功能,如图25,在弹出的对话框中填入D1=seas(1),如图26,定义虚拟变量D1,D1的具体取值见表22.同理可定义虚拟变量D2和D3。图25图26执行EViews估计命令:yctrend(1982.1)d1d2d3估计结果见图27.图27从图27可以看出,D2、D3的回归参数没有显著性,说明不需要把第2季度和第3季度单独分类。从模型中删除这两个变量,执行估计命令:yctrend(1982.1)d1估计结果如图28.图28相应的估计式是:回
15、归结果表明对于该组数据,只需要把第一季度区别于其他3个季度就可以了。如果感觉DW值比较小,可以采用进一步的方法提高DW值,例如:图29实验3模型诊断与检验方法实验一、实验目的通过本次实验,熟悉和掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验。二、实验安排1学时:本实验安排4个学时,主要用于完成实验及实验报告。2时间:由实验室统一安排3地点:由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验;2熟悉使用EVIEWS软件进行掌握
16、4种模型诊断与检验方法的操作方法;(2)实验内容参照下面的实验方法和步骤,进行4种模型诊断与检验方法的应用操作并得出结果。(3)实验方法和步骤1. 邹突变点检验(ChowBreakpointTests)邹突变点检验由邹至庄1960年提出,用于检验模型参数在样本范围内某一点是否发生变化。19852002年中国家用汽车拥有量(yt,万辆)与城镇居民家庭人均可支配收入(xt,元),数据见表31.表31中国家用汽车拥有量(yt)与城镇居民家庭人均可支配收入(xt)数据年份yt(万辆)xt(元)年份yt(万辆)xt(元)198528.49739.11994205.423496.2198634.71899
17、.61995249.964283198742.291002.21996289.674838.9198860.421181.41997358.365160.3198973.121375.71998423.655425.1199081.621510.21999533.885854199196.041700.62000625.3362801992118.22026.62001770.786859.61993155.772577.42002968.987702.8图31图31是关于yt和xt的散点图,从图中看1996年应该是一个突变点。当城镇居民人均可支配收入突破4838.9元之后,城镇居民家庭购买家
18、用汽车的能力大大提高。现在用邹突变点检验法检验1996年是否是一个突变点。原假设是两个子样本(19851995年,19962002年)相对应的模型回归参数相等,备择假设是两个子样本对应的回归参数不相等。在19852002年样本区间作如下回归,ycx2. 点击回归结果窗口中的View键,选Stabilitytests/ChowBreakpointTest功能,如图32.图32图33在随后弹出的对话框中填入1996(如图33),点击OK键,得到检验结果如图34.因为F2720.7远远位于临界值的右侧,所以推翻原假设,结论为1996年是突变点。图34邹模型稳定性检验(ChowForecastTest
19、)仍然使用表31的数据,在用19851999年数据建立的模型基础上,检验当把20002002年数据加入样本后,模型的回归参数是否出现显著性变化。由于已知1996年为结构突变点,所以设定虚拟变量,以区别两个不同的时期。用19852002年数据按以下命令回归,ycxd1x*d1在回归结果窗口中点击View键,选Stabilitytests/ChowForecastTest功能,如图35.图35图36在随后弹出的对话框中填入20020012002(如图36).点击OK键,得到的检验结果如图37.图37由于F值对应的概率为0.73,说明F0.43,位于临界值左侧(原假设接受域),所以接受原假设,结论为
20、模型加入2000,2001,2002年的样本值后,回归参数没有发生显著性变化。3. 似然比检验(LRTest)似然比检验、wald检验、拉格朗日乘数检验都基于MLE(Maximumlikelihoodestimation:极大似然估计),就大样本而言三者是渐进等价的。1)、似然比检验的思想是:如果参数约束是有效的,那么加上这样的约束不应该引起似然函数最大值的大幅度降低。也就是说似然比检验的实质是在比较有约束条件下的似然函数最大值与无约束条件下似然函数最大值。似然比定义为有约束条件下的似然函数最大值与无约束条件下似然函数最大值之比。以似然比为基础可以构造一个服从卡方分布统计量(具体形式参见Gre
21、ene)。2)、wald检验的思想是:如果约束是有效的,那么在没有约束情况下估计出来的估计量应该渐进地满足约束条件,因为MLE是一致的。以无约束估计量为基础可以构造一个Wald统计量(具体形式参见Greene),这个统计量也服从卡方分布;3)、拉格朗日乘数检验(LM)的思想是:在约束条件下,可以用拉格朗日方法构造目标函数。如果约束有效,则最大化拉格朗日函数所得估计量应位于最大化无约束所得参数估计值附近。这里也是构造一个LM统计量(具体形式参见Greene),该统计量服从卡方分布。对于似然比检验,既需要估计有约束的模型,也需要估计无约束的模型;对于Wald检验,只需要估计无约束模型;对于LM检验
22、,只需要估计有约束的模型。一般情况下,由于估计有约束模型相对更复杂,所以Wald检验最为常用。对于小样本而言,似然比检验的渐进性最好,LM检验也较好,Wald检验有时会拒绝原假设,其小样本性质不尽如人意。例:有中国国债发现总量(DEBTt,亿元)模型如下:式(31)其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元),用19802000年的数据,见表32得到估计结果如图38.表32国债发行总量(DEBTt)、GDPt、财政赤字(DEFt)、年还本付息(REPAYt)数据年份DEFt(亿元)GDPt(百亿元)DEFt(亿元)REPAYt
23、(亿元)198043.0145.17868.928.581981121.7448.624-37.3862.89198283.8652.94717.6555.52198379.4159.34542.5742.47198477.3471.7158.1628.9198589.8589.644-0.5739.561986138.25102.02282.950.171987223.55119.62562.8379.831988270.78149.283133.9776.761989407.97169.092158.8872.371990375.45185.479146.49190.071991461.4
24、216.178237.14246.81992669.68266.381258.83438.571993739.22346.344293.35336.2219941175.25467.594574.52499.3619951549.76584.781581.52882.9619961967.28678.846529.561355.0319972476.82744.626582.421918.3719983310.93783.452922.232352.9219993715.03820.67461743.591910.5320004180.1894.4222491.271579.822001460
25、4959.3332516.542007.73图38在用似然比(LR)统计量检验约束GDPt对应回归系数等于零是否成立。检验过程是:在输出结果图38窗口中点击View键,选Coefficienttests/RedundantVariables-LikelihoodRatio功能,如图39.在随后弹出的对话框中填入GDP(如图310),点击OK键,得到检验结果如图311.图39图310图311输出结果的上部给出了关于约束GDP系数为零的F检验和LR检验两种结果,因为相应概率均小于0.05,表明F和LR统计量的值都落在了相应的临界值的右边,即原假设的拒绝域,所以结论是:GDP系数为零的约束不成立。模
26、型中应该保留解释变量GDP。图38给出的是非约束模型的估计结果,图311的下半部分的回归是约束模型(去掉了GDP变量)的估计结果。这一检验也可以以图311下部的回归为基础做,检验路径是,在回归窗口中点击View键,选Coefficienttests/OmittedVariables-LikelihoodRatio功能,在随后弹出的对话框中也填入GDP,则检验结果与图311的上部结果相同。第一种方法是以非约束模型为基础做LR检验,第二种方法是以约束模型为基础做LR检验。注意:似然比(LR)统计量只能检验线性约束。4. Wald检验仍然以表32的数据为例介绍EViews的Wald检验。在输出结果图
27、38窗口中点击View键,选Coefficienttests/Wald-CoefficientRestrication功能,如图3-12.然后在随后弹出的对话框中填入3*c(2)=c(3),如图313.图312图313其中c(2)代表GDPt的回归参数,c(3)代表DEFt的回归参数.点击OK键,得到结果如图314.图315输出结果的上部给出了关于约束条件3*c(2)=c(3)是否成立的Wald检验结果,其中包括F和LR两个统计量。因为相应的概率都大于0.05,表明F和LR统计量的值都落在了相应临界值的左边,济原假设的接受域,所以结论是,约束条件3*c(2)=c(3)成立,是的3倍。图315的
28、下部给出约束条件3*c(2)c(3)=0的样本值和样本标准差。实验4时间序列估计实验一、实验目的通过本次实验,要求掌握以下内容:画时间序列图;求时间序列的相关图和偏相关图,识别模型形式;时间序列模型估计;样本外预测。二、实验安排1学时:本实验安排4个学时,主要用于完成实验及实验报告。2时间:由实验室统一安排3地点:由实验室统一安排三、实验原理、内容、方法和步骤(1)实验要求1通过实例演示,掌握时间序列模型的基本估计方法;2熟悉使用EVIEWS软件进行掌握时间序列模型估计的操作方法;(2)实验内容参照下面的实验方法和步骤,进行时间序列模型估计的应用操作,并得出结果。(3)实验方法和步骤本实验以1
29、9492001年中国人口时间序列数据(表41)为例。表41中国人口时间序列数据(单位:亿人)年份人口yt年份人口yt年份人口yt年份人口yt年份人口yt19495.416719606.620719718.5229198210.159199311.851719505.519619616.585919728.7177198310.2764199411.98519515.6319626.729519738.9211198410.3876199512.112119525.748219636.917219749.0859198510.5851199612.238919535.879619647.0499
30、19759.242198610.7507199712.362619546.026619657.253819769.3717198710.93199812.476119556.146519667.454219779.4974198811.1026199912.578619566.282819677.636819789.6259198911.2704200012.674319576.465319687.853419799.7542199011.4333200112.762719586.599419698.067119809.8705199111.582319596.720719708.299219
31、8110.0072199211.71711. 画时间序列图打开工作文件窗口,双击所要选择的中国人口变量yt,从而打开yt的数据窗口。点击View键,选择Graph/Line功能(如图4-1),就可以得到中国人口时间序列图,如图4-2图41图42从EViews主菜单中点击Quick键,选择Graph/LineGraph功能(见图4-3),在随后弹出的对话框中填入d(y),点击OK键,就可以得到中国人口差分序列图(见图4-4).图43图44从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本保持线性增长趋势。52年间平均每年增加人口1412.69
32、23万人,年平均增长率为16.6。由于总人口数逐年增加,实际上的年人口增长率是逐年下降的。把52年分为两个时期,即改革开放以前的时期(19491978年)和改革开放以后时期(19792001年),则前一个时期的人口年平均增长率为20.0,后一个时期的年平均增长率为12.3,从人口序列yt的变化特征看,这是一个非平稳序列。2. 求中国人口序列的相关图和偏相关图,识别模型形式在中国人口序列yt数据窗口中点击View键、选择Correlogram功能(见图45),可以得到对话框(见图46).其中包括两种选择:对原变量(Level)还是对其一阶差分变量(1stdifference)、二阶差分变量(2n
33、ddifference)求相关图。此项的默认选择是Level。对于本例,选择Level,即选择对yt画相关图、偏相关图。另一项选择是确定相关图的滞后期(Lagstoinclude),这里选择的是10.点击OK键,可以得到yt的相关图、偏相关图(如图47).图的左侧给出的是yt的相关图、偏相关图,右侧给出的是相对于每一个滞后期的估计的自相关系数和偏相关系数值。Q-Stat所对应的列是相应自由度的Q统计量的值。最右侧Prob列的数字表示相应自由度条件下统计量取值大于相应Q值的概率。图45图46图47在图46中选择一阶差分变量(1stdifference),可以得到dyt的相关图、偏相关图(见图48
34、).图48由图47中相关图衰减的很慢,知道中国人口序列yt是非平稳序列,而图48中相关图呈现指数衰减特征可知dyt是平稳序列。通过初步分析,认定dyt是一个1阶或2阶自回归过程。假定先估计AR(2)模型。3. 时间序列模型估计从EViews主菜单中点击Quick键,选择EstimateEquation功能,在随即弹出Equationspecification对话框中输入AR(2)模型估计命令如下:D(Y)cAR(1)AR(2)将样本区间改为19492000年,留下2001年的值用于计算预测精度。点击OK键,可得到估计结果如图49所示。图49由于AR(2)项,即Dyt-2的系数不显著,因此点击E
35、stimate键,从估计命令中剔除AR(2)项继续估计,则得到估计结果如图410.图410对应的模型表达式为:或者直接写为:输出结果中的0.1429是Dyt的均值,表示年平均人口增量是0.1429亿人。整理上述输出结果得到:漂移项0.0547,表示线性趋势的增长速度。从图410输出结果的最后一行知,特征根是10.621.61,满足平稳性要求。点击View选择ResidualsTests/Correlogram-Q-Statistics功能,如图411,可以得到如图412的对话框,选择滞后期为10,点击OK键,可得到如图413的结果。图411图412图413由于右侧一列概率值都大于0.05,说明
36、所有的Q值都小于检验水平为0.05的分布临界值(位于临界值左侧)。结论应该是,模型的随机误差项是一个白噪声序列。通过图413窗口的功能键,可以得到其他的表达形式。例如,点击View键,选择Actual,Fitted,Residual/Actual,Fitted,ResidualTalbe功能(如图414所示),就会得到如图415所示的残差值序列和残差图:图414图415此外,还可以通过方程窗口(Equation)的View功能查看模型结构(ARMAStructure)。点击View键选ARMAStructure功能得到图416的对话框,可以用图形(Graph)或表格(Table)两种形式查看估
37、计模型的特征根(roots)、相关图(correlogram)、脉冲响应(impulseresponse)等。例如在图416的输入状态点击OK键,得到估计结果(图410)对应的理论设定与实际的自相关函数与偏自相关函数图,如图417.图416图417垂直线(蓝线)表示用样本数据得到的相关图和偏相关图,连续(红)曲线表示设定模型对应的相关图和偏相关图,从而可以查看设定模型和样本的拟合程度。4. 样本外预测使用估计出的模型来预测中国2001年的总人口,在图410窗口中点击forecast键,弹出对话窗口。在S.E.(optional)选择区填入yfse,把Forecastsample(预测样本区间)
38、改为20012001,预测方法(Method)选择静态预测(Static),如图411.图411点击OK键,预测结果就会以yf和yfse为变量名保存在工作文件中,打开y、yf、yfse数据组如图412.2001年中国人口12.78806亿人,其标准差为0.045.图412由于已知2001年中国人口的实际数为12.76270亿人,所以预测误差为:类似,可以做2001年的动态预测(Dynamic),也是这个结果。如果预测2002年以后的各年度人口值时,动态预测与静态预测的值将会不同。附录:经济管理定量分析高级方法实验报告书实验题目:姓名:学号:年级、专业、班实验地点:完成时间:教师评语:教师(签名)成绩:阅批时间实验报告的内容学生在实验之后应该按照以下内容撰写实验报告:一、实验目的二、实验原理三、实验内容四、实验步骤五、实验的原始记录及其处理(数据、图表、计算等)六、实验结果及分析实验报告打印要求1按照给定的“实验报告书”封面格式,填写完整后打印2正文版式开本:A4页边距:上:2.4;下:2.0;左:2.4;右:2.4;页眉:1.8;页脚:1.8正文用字:五号宋体,单倍行距;一级标题:小四号宋体,左对齐,上下各空0.5行二级标题:五号黑体,左对齐,独立一行,下文另起行3左边装订-