《金融计量学中文.pptx》由会员分享,可在线阅读,更多相关《金融计量学中文.pptx(518页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/3/221本章要点金融计量学的方法论与应用步骤。金融数据的特点和来源金融计量学软件的使用第1页/共518页2023/3/222第一节 金融计量学的含义及建模步骤一、金融计量学的含义金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。第2页/共518页2023/3/223二、金融计量建模的主要步骤经济理论或金融理论建立金融计量模型数据收集模型估计模型检验不通过通过重新建立模型模型的应用第3页/共518页2023/3/224第一步,把需要研究的金融问题模型化;第二步,收集样本数据;第三步,选择合适的估计方法来估计模型;第四步,对模型进行检验;第五
2、步,对模型进行相应的应用。第4页/共518页2023/3/225三、金融数据的主要类型、特点和来源1.金融数据的主要类型时间序列数据(Time series data)是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的GDP、每年用于表示通货膨胀率的GDP平减指数等。第5页/共518页2023/3/226在分析时间序列数据时,应注意以下几点:(1)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的;(2)不同时间的样本点之间的可比性问题;(3)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关;(4)使用时
3、间序列数据回归模型时应特别注意数据序列的平稳性问题。第6页/共518页2023/3/227横截面数据(Cross-sectional data)是指对变量在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,2004年世界上发展中国家的外汇储备等。平行数据(Panel data)是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,例如30家蓝筹股过去3年每日的收盘价。第7页/共518页2023/3/228 2.金融数据的特点 与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质:(1)金融数据可以更频繁地观察到,可用于计量分析的数据观
4、测值个数可以成千上万,数量十分巨大;(2)金融数据一般都能在交易时准确记录下来;(3)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以及其他的一些特征。第8页/共518页2023/3/2293.金融数据的主要来源政府部门和国际组织的出版物及网站专业信息数据公司,抽样调查第9页/共518页2023/3/2210第二节 金融计量学软件简介 一、金融计量学主要软件简介1.金融计量分析的主要任务从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据
5、进行一系列复杂的数值计算处理。第10页/共518页2023/3/22112.分类(按操作的互动性与否分为)菜单模式,如Microfit命令行模式,如Eviews及介于二者之间的中间模式第11页/共518页2023/3/22123.主要计量经济学软件Eviews软件GAUSS软件LIMDEP软件Mathematica软件Matlab软件Microfit软件Minitab软件RATS软件SAS软件SHAZMA软件S-PLUS软件SPSS软件STATA软件TSP软件第12页/共518页2023/3/2213二、本课程所用软件Microfit4.0和Eviews3.1使用简介以Microfit4.0版
6、本为例。1.数据输入、修改及保存第13页/共518页2023/3/2214图1-2 Microfit 4.0主界面第14页/共518页2023/3/2215图1-3 数据录入设定界面第15页/共518页2023/3/2216图1-4 变量定义、修改窗口第16页/共518页2023/3/2217图1-5 1-5 数据录入界面第17页/共518页2023/3/22182.2.命令窗口及绘图图1-6Microfit命令窗口第18页/共518页2023/3/2219图1-7 19621972年辞职率和失业率线性图第19页/共518页2023/3/2220图1-8 19621972年辞职率和失业率散点图
7、第20页/共518页2023/3/22213.3.一个回归分析案例图1-9Microfit单方程回归分析窗口第21页/共518页2023/3/2222图1-10 1-10 最小二乘估计结果及相关统计量第22页/共518页2023/3/2223图1-11 四种假设检验的结果第23页/共518页2023/3/2224(二)Eviews 3.1使用简介1.数据输入、修改及保存图1-12Eviews新工作文件数据设定窗口第24页/共518页2023/3/2225图1-13 空白新工作文件第25页/共518页2023/3/2226(二)Eviews3.1Eviews3.1使用简介1.数据输入、修改及保存
8、图1-14新工作文件数据导入窗口第26页/共518页2023/3/2227图1-15 1-15 数据导入后工作文件第27页/共518页2023/3/2228图1-16 1-16 察看数据窗口第28页/共518页2023/3/2229图1-17 GDP1-17 GDP和M1M1线性图第29页/共518页2023/3/2230图1-18 1-18 方程设定窗口第30页/共518页2023/3/2231图1-19 1-19 回归结果第31页/共518页2023/3/2232本章小节金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型的设计、建立、估计、检验及使用模型
9、进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。第32页/共518页2023/3/2233本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的Microfit和Eviews计量软件的使用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。第33页/共518页第二章 最小二乘法(OLS)和线性回归模型第34页/共518页202
10、3/3/2235本章要点最小二乘法的基本原理和计算方法经典线性回归模型的基本假定BLUE统计量的性质t检验和置信区间检验的原理及步骤多变量模型的回归系数的F检验预测的类型及评判预测的标准好模型具有的特征第35页/共518页2023/3/2236第一节 最小二乘法的基本属性一、有关回归的基本介绍金融、经济变量之间的关系,大体上可以分为两种:(1)函数关系:Y=f(X1,X2,.,XP),其中Y的值是由Xi(i=1,2.p)所唯一确定的。(2)相关关系:Y=f(X1,X2,.,XP),这里Y的值不能由Xi(i=1,2.p)精确的唯一确定。第36页/共518页2023/3/2237图2-1 货币供应
11、量和GDP散点图第37页/共518页2023/3/2238图2-1表示的是我国货币供应量M2(y)与经过季节调整的GDP(x)之间的关系(数据为1995年第一季度到2004年第二季度的季度数据)。第38页/共518页2023/3/2239但有时候我们想知道当x变化一单位时,y平均变化多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表x与y之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。第39页/共518页2023/3/2240对于变量间的相关关系,我们可以根据大量的统计资料,
12、找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是回归关系(regressiverelationship),所表示的数学方程就是回归方程(regressionequation)或回归模型(regressionmodel)。第40页/共518页2023/3/2241图2-1中的直线可表示为(2.1)根据上式,在确定、的情况下,给定一个x值,我们就能够得到一个确定的y值,然而根据式(2.1)得到的y值与实际的y值存在一个误差(即图2-1中点到直线的距离)。第41页/共518页2023/3/2242如果我们以表示误差,则方程(2.1)变为:即:其中t(=1,2,3,.,T
13、)表示观测数。(2.2)(2.3)式(2.3)即为一个简单的双变量回归模型(因其仅具有两个变量x,y)的基本形式。第42页/共518页2023/3/2243其中yt被称作因变量(dependentvariable)、被解释变量(explainedvariable)、结果变量(effectvariable);xt被称作自变量(independentvariable)、解释变量(explanatoryvariable)、原因变量(causalvariable)第43页/共518页2023/3/2244、为参数(parameters),或称回归系数(regressioncoefficients);t
14、通常被称为随机误差项(stochasticerrorterm),或随机扰动项(randomdisturbanceterm),简称误差项,在回归模型中它是不确定的,服从随机分布(相应的,yt也是不确定的,服从随机分布)。第44页/共518页2023/3/2245为什么将t包含在模型中?(1)有些变量是观测不到的或者是无法度量的,又或者影响因变量yt的因素太多;(2)在yt的度量过程中会发生偏误,这些偏误在模型中是表示不出来的;(3)外界随机因素对yt的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。第45页/共518页2023/3/2246二、参数的最小二乘估计(一)方法介绍本章所介绍的
15、是普通最小二乘法(ordinaryleastsquares,简记OLS);最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。假定根据这一原理得到的、估计值为、,则直线可表示为。第46页/共518页2023/3/2247直线上的yt值,记为,称为拟合值(fittedvalue),实际值与拟合值的差,记为,称为残差(residual),可以看作是随机误差项的估计值。根据OLS的基本原则,使直线与各散点的距离的平方和最小,实际上是使残差平方和(residualsumofsquares,简记RSS)最小,即最小化:RSS=(2.4)第47页/共518页20
16、23/3/2248根据最小化的一阶条件,将式2.4分别对、求偏导,并令其为零,即可求得结果如下:(2.5)(2.6)第48页/共518页2023/3/2249(二)一些基本概念1.总体(thepopulation)和样本(thesample)总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。2、总体回归方程(thepopulationregressionfunction,简记PRF),样本回归方程(thesampleregressionfunction,简记SRF)。第49页/共518页2023/3/2250总体回归方程(PRF)表示变量之间的真实关系,有
17、时也被称为数据生成过程(DGP),PRF中的、值是真实值,方程为:+(2.7)样本回归方程(SRF)是根据所选样本估算的变量之间的关系函数,方程为:注意:SRF中没有误差项,根据这一方程得到的是总体因变量的期望值(2.8)第50页/共518页2023/3/2251于是方程(2.7)可以写为:(2.9)总体y值被分解为两部分:模型拟合值()和残差项()。第51页/共518页2023/3/22523.线性关系对线性的第一种解释是指:y是x的线性函数,比如,y=。对线性的第二种解释是指:y是参数的一个线性函数,它可以不是变量x的线性函数。比如,y=就是一个线性回归模型,但则不是。在本课程中,线性回归
18、一词总是对指参数为线性的一种回归(即参数只以一次方出现),对解释变量x则可以是或不是线性的。第52页/共518页2023/3/2253有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如,(2.10)可以进行如下变换:(2.11)令、,则方程(2.11)变为:(2.12)可以看到,模型2.12即为一线性模型。第53页/共518页2023/3/22544.估计量(estimator)和估计值(estimate)估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。第54页/共518页2023/3/2255三、最小二乘估计量的性质和分布(一)经典线性回归模型的基本假
19、设(1),即残差具有零均值;(2)var30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。统计假设:零假设:是同方差(i=1,2,n)备择假设:具有异方差第134页/共518页2023/3/22135Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:第135页/共518页2023/3/22136第一步,处理观测值。将某个解释变量的观测值按
20、由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。第136页/共518页2023/3/22137第二步,建立回归方程求残差平方和。拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及(n-d)/2-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。对每一个回归模型,计算残差平方和:记值较小的一组子样本的残差平方和为=,值较大的一组子样本的残差平方和为=。第137页/共518页2023/3/22
21、138第三步,建立统计量。用所得出的两个子样本的残差平方和构成F统计量:若零假设为真,则上式中n为样本容量(观测值总数),d为被去掉的观测值数目,k为模型中自变量的个数。第138页/共518页2023/3/22139第四步,得出结论。假设随机项服从正态分布(并且不存在序列相关),则统计量/将服从分子自由度和分母自由度均为()的F分布。对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。第139页/共518页2023/3/22140(二)Spearman rank correlation 检验法 首先引入定义Spearman
22、的等级检验系数:其中 表示第i个单元或现象的两种不同特性所处的等级之差,而n表示带有级别的单元或现象的个数。在这里,我们假设模型为:第140页/共518页2023/3/22141第一步,运用OLS法对原方程进行回归,计算残差 ,i=1,2n。第二步,计算Spearman等级相关系数。将 和解释变量观察值 按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等级取相继等级的算术平均值。然后,计算 与 的等级差 ,的等级 的等级。最后根据公式计算Spearman等级相关系数。第141页/共518页2023/3/22142第三步,对总体等
23、级相关系数 进行显著性检验 :0,:0。样本 的显著性可通过t检验按下述方法加以检验:t 对给定的显著水平 ,查t分布表得 的值,若 ,表明样本数据异方差性显著,否则,认为不存在异方差性。对于多元回归模型,可分别计算 与每个解释变量的等级相关系数,再分别进行上述检验。第142页/共518页2023/3/22143(三)Park检验法 Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤如下:第一步,建立被解释变量y对所有解释变量x的回归方程,然后计算残差(i=1,2,n)第二步,取异方差结
24、构的函数形式为,其中,和是两个未知参数,是随机变量。写成对数形式则为:。第143页/共518页2023/3/22144第三步,建立方差结构回归模型,同时用来代替,即。对此模型运用OLS法。对进行t检验,如果不显著,则没有异方差性。否则表明存在异方差。Park检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为仍可能有异方差性,因而结果的真实性要受到影响。第144页/共518页2023/3/22145(四)Glejser检验法 这种方法类似于Park检验。首先从OLS回归取得残差之后,用的绝对值对被认为与密切相关的X变量作回归。有如下几种函数形式(其中 是误
25、差项):第145页/共518页2023/3/22146Glejser检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。第146页/共518页2023/3/22147(五)Breusch-Pagan检验法 该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。设模型为:(3.7)并且(3.8)在式(3.8)中 表示是某个解释变量或全部。第147页/共518页2023/3/22148提出原假设为
26、 ,具体步骤如下:第一步,用OLS方法估计式(3.7)中的未知参数,得 (3.9)和 (n为样本容量)(3.10)第二步,构造辅助回归函数 (3.11)式中 为随机误差项。第148页/共518页2023/3/22149第三步,用OLS方法估计式(3.11)中的未知参数,计算解释的平方和ESS,可以证明当有同方差性,且n无限增大时有第四步,对于给定显著性水平 ,查 分布表得 ,比较 与 ,如果 ,则拒绝原假设,表明模型中存在异方差。第149页/共518页2023/3/22150(六)White检验 White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因,并且要
27、求随机误差服从正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。下面是White检验的基本步骤:设二元线性回归模型为(3.12)第150页/共518页2023/3/22151异方差与解释变量的一般线性关系为第一步,用OLS法估计式3.3的参数。第二步,计算残差序列和。第三步,求对,的线性回归估计式,即构造辅助回归函数。第四步,计算统计量,其中n为样本容量,为辅助回归函数中的决定系数。第151页/共518页2023/3/22152第五步,在的原假设下,服从自由度为5的分布,给定显著性水平,查分布表得临界值,比较与,如果前者
28、大于后者,则拒绝原假设,表明式(3.12)中随机误差存在异方差。此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用ARCH方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检验结果进行分析比较,以求得出更准确的结论。第152页/共518页2023/3/22153第三节 异方差的修正 异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利
29、影响。其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。第153页/共518页2023/3/22154 一、当为 已知:加权最小二乘法 (weighted least squares,WLS 在同方差的假定下,对不同的,偏离均值的程度相同,取相同权数的做法是合理的。但在异方差情况下,则是显而易见的错误,因为的方差在不同的上是不同的。比如在递增异方差中,对应于较大的x值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的x值,偏差较小,应给予重视。第154页/共518页2023/3/22155所以在这里我们的办法
30、就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。第155页/共518页2023/3/22156可以考虑用作为的权数。于是加权最小二乘法可以表述成使加权残差平方和达到最小。第156页/共518页2023/3/22157 二、当 为未知 已知真实的可以用WLS得到BLUE估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为这样几种类别。我们以为模型。(一)正比于:可对原方程做如下变换:第157页/共518页2023/3/22158(二)正比于:就可将原始的模型进行
31、入下变换(三)正比于Y均值的平方:将原模型进行如下变换:第158页/共518页2023/3/22159在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:1.当解释变量多于1个时,也许先验上不知道应选择哪一个X去进行变换;2.当无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验F检验等的检验程序,都只有在大样本中有效。3.谬误相关的问题。第159页/共518页2023/3/22160 三、模型对数变换法 仍以模型为例,变量和分别用和代替,则对模型进行估计,通常可以降低异方差性的影响。原因?第160页
32、/共518页2023/3/22161第四节 金融实例分析例3-1纽约股票交易所(NYSE)与美国证券交易委员会(SEC)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。第161页/共518页2023/3/22162下面通过一个具体金融案例来讨论异方差的检验与修正过程:根据北京市1978-1998年人均储蓄与人均收入的数据资料,若假定X为人均收入(元),Y为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。设模型为第162页/共518页2023/3/22163图3-3 Eviews回归结果1用OLS估计法估计参数第163页
33、/共518页2023/3/22164图3-4 残差图(1)图示法第164页/共518页2023/3/22165(2)Goldfeld-Quandt检验按前述检验方法,对19781985与19911998年时间段的数据进行OLS方法检验,求出F统计量,查表得是否存在异方差第165页/共518页2023/3/22166(3)ARCH检验 图3-5ARCH检验结果第166页/共518页2023/3/22167异方差的修正:WLS法图3-6WLS估计结果第167页/共518页2023/3/22168对数变换法 图3-7对数变换估计结果第168页/共518页2023/3/22169第五节 自相关的概念和
34、产生原因 为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。例:利率的变化我们将用工业生产指数(IP),货币供应量增长率(GM2),以及通胀率(GPW)的函数来解释国债利率R的变化。第169页/共518页2023/3/22170R=3个月期美国国债利率。为年利率的某一百分比IP联邦储备委员会的工业生产指数(1987=100)M2=名义货币供给、以十亿美元为单位PW所有商品的生产价格指数(1982=100)第170页/共518页2023/3/22171用于回归模型的货币与价格变量是:回归方程是:(括号中为t统计量)(2.84)(8.89)(3.9
35、1)(6.15)=0.22DW=0.18S=2.458Mean=6.07第171页/共518页2023/3/22172 一、滞后值与自相关的概念 在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子:滞后一期的取值,记为。y的一阶差分,记为,是用y的当期值减去前一期的值:,以此类推,可以得到滞后二期,滞后三期值。第172页/共518页2023/3/22173 表3-1 当期值、滞后值、差分的关系 1990.10.81990.21.30.80.51990.3-0.91.3-2.21990.40.2-0.91.11990.5-1.70.2-1.91990
36、.62.3-1.74.01990.70.12.3-2.21990.80.00.1-0.1 第173页/共518页2023/3/22174回到自相关问题,在回归模型:经典线性回归模型(CLRM)的基本假设第三条是:若此假设被破坏,即,随机误差项u的取值与它的前一期或前几期的取值(滞后值)有关,则称误差项存在序列相关或自相关。自相关有正相关和负相关之分。实证表明:在经济数据中,常见的是正自相关。第174页/共518页2023/3/22175(a)正自相关第175页/共518页2023/3/22176(b)负自相关第176页/共518页2023/3/22177(c)无自相关第177页/共518页20
37、23/3/22178 二、自相关产生的原因 1.经济数据的固有的惯性(inertia)带来的相关2.模型设定误差带来的相关3.数据的加工带来的相关第178页/共518页2023/3/22179第六节 自相关的度量与后果 一、自相关的度量假定存在自相关,若的取值仅与前一期有关,即=f(),则称这种自相关为一阶自相关。对于一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响越小。如果存在自相关的话,最强的自相关应该是一阶自相关。这里,我们只讨论一阶自相关,并且假定这是一种线性自相关,具有一阶线性自回归AR(1)的形式:第179页/共518页2023/3/22180式中为常数,称为自相关系
38、数。是一个新随机项,它满足经典回归的全部假定。上式可以看成是一个一元回归模型。是因变量,是自变量,是回归系数。可用OLS法估计:第180页/共518页2023/3/22181当0时,为正相关,0.8),或F检验值显著,但单个解释变量系数估计值却不显著;或从金融理论知某个解释变量对因变量有重要影响,但其估计值却不显著,则可以认为存在严重的多重共线性问题。若两个解释变量之间的相关系数高,比如说大于0.8,则可以认为存在严重的多重共线性。第214页/共518页2023/3/22215判断多重共线性的存在范围 要确定多重共线性是由哪些主要变量引起的,可以采用辅助回归法(auxiliaryregress
39、ionmethod)。所谓辅助回归是指某一解释变量对其余解释变量的回归,区别于因变量对所有解释变量回归的主回归(mainregression)。辅助回归法构造的检验统计量定义如下:服从自由度为k-1与n-k的F分布其中(i=1,2,k)为第i个解释变量关于其余解释变量的辅助回归的拟和优度,k为解释变量的个数,n代表样本容量。第215页/共518页2023/3/22216检验多重共线性的表现形式 当确定多重共线性是由哪些主要变量引起后,若要找出与主要变量有共线性的解释变量,即确定多重共线性的表现形式,可采用偏相关系数法。解释变量与偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。偏相
40、关系数法构造的检验统计量定义如下:,服从自由度为n-k-1的t分布其中n为样本容量,k为解释变量的个数,为与的偏相关系数。若显著不为零,则认为、是引起多重共线性的原因,否则不是。第216页/共518页2023/3/22217多重共线性的修正 如前所述,多重共线性在金融数据中是普遍存在的,是否对多重共线性采取修正措施取决于多重共线性的严重程度。若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,t值显著),则可以忽略多重共线性问题。若多重共线性对重要因素的系数估计值有严重的影响,则必须进行补救。采取何种补救措施,则取决于多重共线性因素的重要性、其它数据来源的可用性、所估计模型的目的以及其它
41、需要考虑的事项。以下将介绍几种补救措施。第217页/共518页2023/3/22218多重共线性的修正一、删除不必要的变量如果在产生多重共线性的因素中有相对不重要的变量,则可试着将其删除,这是解决多重共线性最简单的方法,但删除变量也可能会导致新问题的产生:(1)被删除变量对因变量的影响将被其它解释变量和随机误差项所吸收,这可能一方面解决了一部分变量的多重共线性问题,但另一方面却又同时增强了另一部分变量的多重共线性问题,而且,还可能使随机误差项的自相关程度增强。(2)删除某个变量可能会导致模型设定误差(specificationerror)。所谓模型设定误差,指的是在建立回归模型的过程中,因为错
42、误设定模型结构而产生的误差。错误的删除解释变量将会导致最小二乘估计值是有偏的。第218页/共518页2023/3/22219二、改变解释变量的形式。1、差分法对于时间序列数据而言,若原始变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度。例如对于模型,可把变量变换为差分形式:2、指数增长率方法例如研究三种指数关系时,可用如下模型:第219页/共518页2023/3/222203、以比率代替高度相关的变量若模型中存在高度相关的变量,在不违反金融理论的前提下,可以求得两者之间的比率,并以此比率代替相应变量出现在模型中。例如对于模型,若与之间高度相关,且模型的目
43、的是用于预测,则可令,则可在一定程度上消除多重共线性此外,当模型中有较多解释变量的滞后值,并存在严重多重共线性时,可以考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度。第220页/共518页2023/3/22221多重共线性的修正三、补充新数据。由于多重共线性是一样本特征,故有可能在关于同样变量的另一样本中共线性没有第一个样本那么严重。Christ(1966)认为:解释变量之间的相关程度与样本容量成反比,即样本容量越小,相关程度越高;样本容量越大,相关程度越小。因此,收集更多观测值,增加样本容量,就可以避免或减轻多重共
44、线性的危害。第221页/共518页2023/3/22222多重共线性的修正四、利用先验信息法。这里的先验信息,包括从金融理论以及实际统计资料所获得的解释变量或所估计参数之间的关系。若发生多重共线性的那些解释变量之间的关系可由先验信息得到,则在所研究的模型中利用这种关系,便可以减轻多重共线性的程度。第222页/共518页2023/3/22223金融数据的多重共线性处理:示例理论上,股票代表着对公司未来现金流的所有权,因此,公司未来的收益以及利息是股票价格的决定因素。而宏观经济形势能够影响到公司未来的收益,进而对股票价格产生影响。同时宏观经济形势也能够通过其它的一些渠道直接对股票价格产生影响。我们
45、将以整个股票市场为研究对象,来考虑影响股票价格指数的宏观经济因素以及它们的影响程度。我们将采取从一般到特别的建模方式,即首先将模型中包含尽可能多的变量,然后通过各种检验逐步剔出对因变量没有解释能力的变量。第223页/共518页2023/3/22224对影响股票价格指数宏观经济因素的实证分析 我们选择上证综指(以Y表示)作为股票价格指数的代表。对于影响股票价格指数的宏观经济因素,初步选定如下的十个宏观变量:居民消费物价指数、商品零售物价指数、企业商品价格指数、工业增加值、固定资产投资、社会消费品零售总额、股市成交量、外汇市场交易量、汇率、货币供应量m1、进出口额。分别以至代表。其中前三个价格指数
46、从不同侧面反映了我国的市场环境,而则从不同侧面反映了整体经济状况,反映了我国金融环境的影响,股市成交量从一个侧面反映了股市状况。我们采用的数据是从2000.12004.9月的月度数据,对于价格指数变量以及汇率,我们以原变量形式进入模型,而对于其它变量,我们取其对数形势进入模型。第224页/共518页2023/3/22225在对数据调整后,我们建立如下的模型:利用普通最小二乘法回归方程,得到如下的结果:去掉不显著的变量,对模型重新回归得到:第225页/共518页2023/3/22226在10%的显著性水平下,变量系数估计值的t值都是显著的,模型的=0.78,=0.75,总体上看模型是不错的。尽管
47、估计值的t值是显著的,我们仍来检验该模型解释变量之间是否存在多重共线性,因为若两个变量之间存在高度相关并且符号相反,他们的作用就会相互抵消,从而有可能两个变量都是显著的。首先,根据和t值,我们无法发现多重共线性,因此我们将利用变量之间的相关系数来判断。第226页/共518页2023/3/22227在Eviews软件中,要获得检验解释变量两两之间的相关系数矩阵是很容易的,我们只需在命令窗口中键入“COR”命令以及相应的解释变量。图4-1相关系数矩阵第227页/共518页2023/3/22228分别删除、再进行回归得到的结果如下:图4-2删除后的回归结果第228页/共518页2023/3/2222
48、9图4-3删除后的回归结果第229页/共518页2023/3/22230分别删除X6、X10后得到的结果如下:图 4-4 删除X6 后的回归结果第230页/共518页2023/3/22231图4-5删除X10后的回归结果第231页/共518页2023/3/22232最后得到的模型是:我们之所以在原回归方程系数估计值都显著的情况下仍进行多重共线性检验,并删除一些变量,是因为在金融计量学中,在保证模型一定解释能力的情况下,尽可能的使模型简洁,是我们应该始终坚持的一个原则。在这个例子中,我们仅考虑了对模型解释变量的多重共线性检验,在实际建模以及估计过程中,还应该考虑模型的自相关性、异方差性等的检验。
49、第232页/共518页2023/3/22233虚拟变量模型 在本章余下的四节中,我们将讨论虚拟变量在回归分析中的应用。虚拟变量既可以作为解释变量出现在模型中,也可以作为因变量出现在模型中,我们统称这类含虚拟变量的经济计量模型为虚拟变量模型。第233页/共518页2023/3/22234虚拟变量的性质 在金融计量学中,所考虑的变量除了可以直接度量的数量变量(如价格、收益、收入等)之外,还有实质上是定性性质的变量,如性别、国家、战争及政府经济政策的变动等。这类定性变量常指某一性质、属性出现或不出现,例如男性或女性,中国人或外国人,战争期间或非战争期间等。由于其不能直接度量,为研究方便,可构造一个变
50、量,令其取值为1或为0,取值为0时表示某一性质出现(不出现),取值为1时表示某性质不出现(出现),该变量即为虚拟变量(dummyvariables)。第234页/共518页2023/3/22235一般的,在虚拟变量的设置中,基础类型、否定类型取值为“0”,称为基底(base)类、基准(benchmark)类或参考(reference)类;而比较类型、肯定类型取值“1”。虚拟变量和定量变量在回归模型中的应用是一样的。若一个模型中的解释变量全部都是虚拟变量,则此模型被称为方差分析模型(AnalysisofVarianceModel);若解释变量中既有定量变量,又有虚拟变量,则该线性回归模型可称为协