《eviews入门模型线性回归模型.ppt》由会员分享,可在线阅读,更多相关《eviews入门模型线性回归模型.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 线性回归模型v一元线性回归模型v多元线性回归模型v可线性化模型v虚拟变量一元线性回归模型案例vCase1是黑龙江省伊春林区1999年16个林业局的年木材采伐量和相应伐木剩余物数据。v下面利用该数据介绍怎样利用EViews软件进行OLS回归v1、数据文件的读取或打开、数据文件的读取或打开。v2、画散点图、画散点图。v 命令方式:scat y xv 菜单方式:从EViews主菜单中点击Quick键,选择Graph/Scatter功能v Group操作方式:首先要将序列y和x组成一个群,再在主窗口选择菜单View/Graph/Scatter v画图时应该先输入横轴的变量名,再输入纵轴的变量名
2、。v3、OLS估计估计v菜单操作方式:从工作文件主菜单中点击Quick/Estimate Equation功能。v方程设定(Equation Specification)对话框:在选择框中输入y c x,或输入y=C(1)十C(2)*x,表示一个一元线性回归方程。v命令操作方式:Ls y c xv4、结果显示结果显示v点击方程对象窗口中的View键:vActual,Fitted,Residua/Actual,Fitted,Residual Table功能,可以得到图形,用来进行残差分析。vPresentation,可以得到输出结果的代数表达式vStats键,可以还原回第一种显示方式。vName
3、键,可以为此输出结果命名vEstimate键,可以随时改变估计模型的数学形式、样本范围以及估计方法。v输出结果中,vStd.Error(标准误差):主要用来衡量回归系数的统计可靠性。标准误差越大,回归系数估计值越不可靠。vt-Statistic(t统计量):检验的是某个系数是否为零(该变量是否不存在于回归模型中)。prob(概率),此列显示在服从t分布条件下,对应其左侧一列t统计量值的概率。通过这一信息可以方便地分辨出是拒绝还是接受系数真值为零的假设。正常情况下,概率低于0.05即可认为对应系数显著不为零。vR-squared(可决系数):表示拟合优度的好坏,可决系数越大,方程拟合得越好。vS
4、.E.of regression(回归的标准误差):这是一个对预测误差大小的总体度量,是对残差大小的度量。vSum squared resid(残差平方和):是残差的平方和,可以用做一些检验的输入值。vLog likelihood(对数似然估计值):是在系数估计值的基础上对对数似然函数的估计值(假定误差服从正态分布)。可以通过观察方程的约束式和非约束式的对数似然估计值的差异;进行似然比检验。vDurbin-Watson stat(DW统计量):这是对序列相关性进行检验的统计量。如果它比2小很多,则证明这个序列正相关 vMean Dependent Var(被解释变量的均值):被解释变量的样本均
5、值。vF-Statistic(F统计量):这是对回归方程中的所有系数均为0(除了常数项)的假设检验。Prob(F-Statistic)(F统计量对应的概率):该项是由上面F统计量的值计算出的概率。X=20条件下模型的样本外预测方法v把工作文件范围从原来的116改为1 17。v打开x的数据窗口,利用Edit+/-键给x的第17个观测值赋值为20。v输出结果窗口中点击Forecast键,随即弹出一个关于预测(Forecast)的对话框。yf 在Forecast name选择区自动生成,yf是保存预测值的变量。v在Forecast sample选择区把预测范围从1 17改为17 17,即只预测x=2
6、0时的y的值。多元线性回归模型案例vcase2是1950-1987年间美国机动汽油消费量和影响消费量的变量数值。其中各变量表示:QMG-机动车汽油消费量;MOB-汽车保有量;PMG-机动汽油零售价格;POP-人口数;GNP-按照1982年美元计算的GNP;以汽油消费量为因变量,其它变量为自变量,建立一个回归模型。v1、建立模型v菜单方式:选object/new object,在新建对象对话框中选对象为Equation,并命名,点击OKv或选Quick/estimate equation.v命令方式:v在主窗口命令行输入:vLs qmg=c(1)+c(2)*car+c(3)*pmg+c(4)*p
7、op+c(5)*rgnpv或等价的输入变量列表vLs Qmg c car pmg pop rgnp v2预测v菜单命令是对方程对象操作proc/forecast,或直接从工具栏中选Forecast,Eviews会产生一个新的对话框,可以生成名为原自变量名加f名的新序列,也可自己命名。vRMSE 均方根误差;vMAE平均绝对误差vMAPE即平均绝对百分误差 vTheil inequality coefficient 希尔不等系数 vBias proportion 偏差率vVariance proportion 方差率vCovariance proportion 协变率 多元线性回归模型的极大似然
8、估计v用对数极大似然估计来估计一个模型,主要的工作是建立用来求解似然函数的说明文本。vEViews中似然函数的说明只是一系列对序列的赋值语句,这些语句在极大化的过程中被反复的计算。v我们要做的是写下一组语句,在计算时,这些语句将描述一个包含每个观测值对似然函数贡献的序列。利用极大似然法估计模型参数这就是变量Y的似然函数。对似然函数求极大值和对对数似然函数求极大值是等价的。EViews编程v以case1为例。v先在object中打开logl对象v在logl对象窗口输入:vlogl logl1vparam c(1)-0.7 c(2)0.4 c(3)4vRes=y-c(1)-c(2)*xvVar=c
9、(3)vLogl1=log(dnorm(res/sqrt(var)-log(var)/2v 线性化方法v在某些情形下,可以将这些非线性模型,通过一定的变换线性化,作为线性模型处理。这类模型称为可线性化的非线性模型。例3vcase3是某企业在16个月度的某产品产量(X)和单位成本(Y)资料,研究二者关系。v为了明确产量和单位成本是何种关系,先绘制散点图。v三个备选模型:v按照线性化的法则,建立非线性模型有两种方法v1、用genr命令按变换函数生成新序列,再运用LS命令对新序列进行参数估计。vGenr z=1/xvLs y c z v2、在使用LS命令时直接对序列进行操作而不必生成任何新序列。vL
10、s y c 1/xv在条件许可的情况下建议使用第二种处理方法。v从输出结果看,上述三种模型的回归系数和回归方程都通过了显著性检验。说明用这三种模型来描述x和y的关系都是很好的。决定系数相差不大,但双曲线的决定系数最大。v以双曲线模型作为终选模型。虚拟变量的应用v一般的线性回归模型,变量取值都是具体的连续数值,例如国民生产总值、职工年人均收入等,这些都属于定量变量定量变量。然而,实际问题中经常会碰到这样一些变量,如性别、职称、历史时期(计划经济或市场经济)等,不是用数值度量的,被称为定性变量定性变量。含有定性变量的线性回归问题可分为自变量含定性自变量含定性变量变量和因变量含定性变量因变量含定性变
11、量两种情况,由于后者比较复杂,本节只讨论自变量含定性变量的情况。v1虚拟变量的设立v在建立回归模型之前,首先应对属于定性变量的自变量加以数量化处理,常用方法是引入只取0和1两个值的名义(Dummy)变量。v例如研究职工工作量的回归模型:v其中,yi和xi分别表示第i个职工的工作量及工作时间,vDi是一个定性变量。引入的虚拟变量,又称哑变量。v当描述的事物或现象有m种情况时,引入虚拟变量的个数应为m-1。v2、虚拟变量的引入方式v(1)加法类型v(2)乘法类型v 用不同方式引入虚拟变量将反映不同的影响效果,所以设置虚拟变量时,最好先根据散点图或经先根据散点图或经济分析,大致判断济分析,大致判断定
12、性因素的影响类型(即影响截距还是斜率),然后再用加法方式或乘法方式在模型中设置虚拟变量。v实际应用中,事先往往难以确定定性因素的影响类型。因此,一般是直接以加法和乘法方式引入直接以加法和乘法方式引入虚拟变量,然后再利用t检验判断其系数是否显著不等于0,进而确定虚拟变量的引入方式。v3EViews的操作v解释变量中含有定性变量的问题比较简单,EViews的操作步骤与一般多元线性回归模型的建模过程基本相同,只需将定性变量看作一般数值变量操作即可。例 case24v回归函数的截距有特定的经济学意义,这里它代表了女教师的平均初职年薪v对回归模型的解释如下,当性别变量为常量时,平均年薪将增加1371美元
13、,当教龄变量保持不变时,男老师的平均年薪比女老师多3334美元。由于虚拟变量的系数是统计显著的,因此我们能够说两类老师的平均年薪不同,虽然男女老师平均年薪对教龄有相同的年增长率。例5v中国进出口模型。中国进出口贸易总额数据(1950-1984年)见trade.xls。试检验改革开放前后该时间序列的斜率是否发生变化。v以1978年前为0例6 虚拟变量在季节调整中的应用v1982:1 1985:4中国季度酒销量(y,,万吨)数据见case36,这是一个时间序列数据,呈明显的季节变化特征,建立模型时应该加入季节虚拟变量以描述季节特征。v首先作图,观察季节波动趋势与长期趋势。v从工作文件主菜单中点击Quick键,选Generate Series功能、弹出的对话框中填入DI=seas(1)定义虚拟变量D1,v即如果数据属于第1季度则D1=1,否则D1=0。v同理定义虚拟变量D2、D3以区别第2季度和第3季度的值(注意:不能在含有常数项的模型中同时使用4个虚拟变量)。v执行EViews估计命令v y c trend(1982.1)d1 d2 d3v由于D2、D3的回归参数没有显著性,说明没有必要把第2季度、第3季度单独分类。从模型中剔除虚拟变量D2、D3,v执行EViews估计命令,y c trend(1982.1)d1v估计结果说明对于这组数据,只把第1季度区别于其他3个季度就可以了