《经济计量学 教程ygg.docx》由会员分享,可在线阅读,更多相关《经济计量学 教程ygg.docx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、经济计量学第一章 绪论一、定义:经济计量学(EEconommetriccs)一词是是由挪威经济济学家、第一一届诺贝尔经经济学奖得主主拉格纳弗瑞希(Raagnar Friscch)19226年仿照生生物计量学(Biometrics)一词提出的。经济计量学的任任务是以经济济学、统计学和数学之间的统统一为充分条条件,去实际际理解现代经经济生活中的的数量关系。二、经济计量学学的内容体系系1、理论经济计计量学(1)理论经济济计量学:是寻找适当当的方法,去去测度由经济济计量模型设设定的经济关关系式。(2)经济计量量方法:单方程估计方法法、联立方程程系统估计方方法2、应用经济计计量学经济计量学的实实际应用过
2、程程,主要是建建立、估计和和检验各类经经济计量模型型,以达到结结构分析、经济预测和政策评价的目目的。应用经济计量学学:以经济理论论和事实为出出发点,应用用计量方法,解解决经济系统统运行过程中中的理论问题题或实践问题题。三、经济计量学学的研究步骤骤1、模型方程式的种类2、模型变量的种类四、使用模型一、建立模型1、收集模型所含经济变量的数据2、方程识别条件的研究3、选择适当的经济计量方法估计模型参数1、经济理论准则2、统计准则3、经济计量准则二、估计参数三、验证模型1、建立模型建立模型是根据据经济理论和和某些假设条条件,区分各各种不同的经经济变量,建建立单一方程程式或方程体体系,来表明明经济变量之
3、之间的相互依依存关系。(1)模型方程程式的种类1)随机方程:是根据经济行为为构造的函数数关系式,带有随机误误差项。由于于经济计量模模型中的随机机方程是根据据经济行为构构造的,因此此,也常称它它们为“行为方程”。2)非随机方程程:是根据经济学理理论或政策、法法规而构造的的经济变量恒恒等式。由于于经济计量模模型中的非随随机方程是根根据理论、政政策、法规确确定的,因此此常称它们“定义方程”、“制度方程”或“政策方程”。(2)模型变量量的种类1)按照它们的的数值是在什什么范围决定定为标准:内内生变量、外外生变量内生变量:具具有一定概率率分布的随机机变量,由模模型自身决定定,其数值是是求解模型的的结果。
4、外生变量:是是非随机变量量,在模型体体系之外决定定,即在模型型求解前已得得到了数值。内生变量和外生生变量的划分分是相对的,二二者没有不可可逾越的鸿沟沟,什么作内内生变量,什什么作外生变变量,常常是是由模型设计计者根据具体体情况决定的的。2)被解释变量量、解释变量量对于一个方程来来说,等号左左边的因变量量称为被解释释变量(Exxplainned Vaariablle),等号号右边的自变变量称为解释释变量(Exxplainning VVariabble)。在模型中,一个个方程的被解解释变量可能能是其它方程程的解释变量量。被解释变变量一定是模模型的内生变变量,但解释释变量除包括括外生变量之之外,还可
5、能能包括一些内内生变量。3)滞后变量、前前定变量有些方程还使用用内生变量的的前期或前几几期的数值作作解释变量,我我们称这样的的变量为滞后后变量(Laagged Variaable)。滞滞后变量如同同外生变量一一样,在模型型求解之前为为已知的。故故一般将外生生变量和滞后后变量合称为为前定变量(PPredetterminned Vaariablle)。经济变量内生变量前定变量滞后变量外生变量外生经济变量政策变量虚拟变量2、估计参数(1)收集模型型所含经济变变量的数据1)时间序列数数据:某一经济变变量在各个时时期的数值按按时间先后顺顺序排列所形形成的数列2)截面数据:在同一时点点或时期上,不不同统计
6、单位位的相同统计计指标组成的的数据3)混合数据:是指兼有时时间序列和截截面数据两种种成份的数据据4)虚拟变量数数据:是经济济计量学家为为不能量化的的定性变量而而设定的(2)方程识别别条件的研究究(3)选择适当当的经济计量量方法估计模模型参数3、验证模型(1)经济理论论准则经济理论准则即即根据经济理理论所阐明的的基本原理,以以此对模型参参数的符号和和取值范围进进行检验;就就是据经济理理论对经济计计量模型中参参数的符号和和取值范围施施加约束。假如参数实际估估计值的符号号和大小与经经济理论分析析不符,就应应舍弃;除非非有充足理由由使人们相信信,在某种特特定情况下经经济理论的原原理不成立。(2)统计准
7、则则统计准则是由统统计理论决定定的,统计准准则的目的在在于考察所求求参数估计值值的统计可靠靠性。由于所所求参数的估估计值是根据据经济计量模模型中所含经经济变量的样样本观测值求求得的,便可可以根据数理理统计学的抽抽样理论中的的几种检验,来来确定参数估估计值的精确确度。1)根据样本观观测值计算的的判定系数是是一种统计量量,它表示由由解释变量说说明被解释变变量的程度2)参数估计量量的标准差是是参数估计量量与参数真实实值的离差的的一种度量。参参数估计量的的标准差愈大大,则它的可可靠性愈小,参参数估计量的的标准差愈小小,则它的可可靠性愈大。3)应该着重指指出,若根据据经济理论准准则,验证所所求参数估计计
8、值具有“错误”符号或大小小,即使这些些参数估计值值在统计上是是显著的,也也应当舍弃这这些参数的估估计值。统计计准则对经济济理论准则而而言,它是第第二位的或是是次要的。(3)经济计量量准则经济计量准则是是由理论经济济计量学决定定的,其目的的在于研究任任何特定情况况下,所采用用的经济计量量方法是否违违背了经济计计量模型的假假定。经济计量准则作作为二级检验验,可视为统统计准则的再再检验。经济济计量准则是是确定所求参参数估计值的的正确与否。这这些准则有助助于我们确定定所求参数估估计值是否具具有合乎最佳佳线性无偏误误估计量的性性质,即无偏偏性、一致性性和有效性等等等。4、使用模型(1)结构分析析就是利用
9、已估计计出参数值的的模型,对所所研究的经济济系统变量之之间的相互关关系进行分析析,目的在于于了解和解释释有关经济变变量的结构构构成和结构变变动的原因。(2)预测未来来就是根据已估计计出参数值的的经济计量模模型来推测内内生变量在未未来时期的数数值,这是经经济计量分析析的主要目的的之一。(3)规划政策策这是经济计量模模型的最重要要用途,也是是它的最终目目的。规划政政策是由决策策者从一系列列可供选择的的政策方案中中,挑选出一一个最优政策策方案予以执执行。一般的操作步骤骤是先据模型型运算一个基基本方案,然然后改变外生生变量(政策策变量)的取取值,得到其其它方案,对对不同的政策策方案的可能能后果进行评评
10、价对比,从从而做出选择择,因此又称称政策评价或或政策模拟。第二章 一元元线性回归模模型第一节 回归归分析的相关关概念一、回归的含义义1、回归一词的的原始含义:高尔顿普遍遍回归定律2、现代回归概概念:回归分析就是研研究被解释变变量对解释变变量的依赖关关系,其目的的就是通过解解释变量的已已知或设定值值,去估计或或预测被解释释变量的总体体均值。这种一个变量依依赖于另一个个或多个变量量的事例在经经济系统中普普遍存在。回回归分析就是是要研究这种种变量之间的的依存关系。二、统计关系与与确定性关系系三、回归分析与与相关分析与回归分析密切切相联的是相相关分析。相相关分析主要要测度两个变变量之间的线线性关联度,
11、相相关系数就是是用来测度两两个变量之间间的线性关联联程度的。在回归分析中,被被解释变量YY被当作是随随机变量,而而解释变量XX则被看作非非随机变量。而而在相关分析析中,我两者者处于平等地地位,不存在在谁为解释变变量,谁为被被解释变量的的问题,两者者均为随机变变量。第二节 一元元线性回归模模型一、 引例条件平均值落在在一根有正斜斜率的直线上上。我们称这这根直线叫做做总体回归线线,它是Y 对X 的回归。总体回归线:就就是当解释变变量取给定值值时,被解释变量量的条件均值值或期望值的的轨迹。二、 总体回归函数E(Y/Xi)= f (Xi)总体回归函数,简简称总体回归归。它表明在在给定Xi 下Y 的分布
12、的的总体均值与与Xi有函数关关系,就是说说它给出了YY 的均值是是怎样随X 值的变化而而变化的。函数f (Xii)采取什么么函数形式,是是一个需要解解决的重要问问题。在实际际经济系统中中,我们不会会得到总体的的全部数据,因因而就无法据据已知数据确确定总体回归归函数的函数数形式。同时时,对总体回回归函数的形形式只能据经经济理论与经经验去推断。三、 线性的含义1、对变量为线线性对线性的第一种种解释是指YY 的条件期望望是Xi 的线性性函数2、对参数为线线性对线性的第二种种解释是指YY 的条件期期望 是参数 的一个线性性函数。它可可以是也可以以不是变量的的X 的线性函函数。在本课中,主要要考虑的是对
13、对参数为线性性的回归模型型,线性回归归是指对参数数为线性的一一种回归(即即参数只以它它的1次方出现);对解释变量量X则可以不是是线性的。四、 总体回归函数的的随机设定1、 代代表相同收入入水平的所有有家庭的平均均消费支出。这这是系统性或或确定性成份份。2、ui 为随随机或非系统统性成份,代代表所有可能能影响Y,但又未能能包括到回归归模型中来的的被忽略变量量的代理变量量。五、 随机误差项u 的意义1、理论的欠缺缺2、数据的欠缺缺3、核心变量与与非核心变量量4、人类行为的的内在随机性性5、节省原则,我我们想保持一一个尽可能简简单的回归模模型六、 样本回归函数样本回归线,因因抽样波动,它它们都是总体
14、体回归线的一一个近似。回归分析中的主主要目的就是是根据样本回回归函数:来估计总体回归归函数:由于抽样的波动动,我们根据据样本回归函函数估计出来来的总体回归归函数只能是是一个近似结结果。因此怎怎样构造样本本回归函数能能使尽可能接接近真实的就就成为回归分分析的核心第三节 最小小二乘估计在回归分析中有有很多种构造造样本回归函函数的方法,而而最广泛使用用的一种是普普通最小二乘乘法(metthod oof orddinaryy leasst squuares, 简记OLLS)一、普通最小二二乘法(OLLS)为使样本回归模模型的估计值值尽可能地靠靠近观测值YYi,我们就必须须使用最小二二乘准则,使使:尽可
15、能地地小,其中,是残差的平方。上面得到的估计计量 , 是从最小二二乘原理演算算而得的,因此称为最最小二乘估计计量。二、经典线性回回归模型如果我们的目的的仅仅是估计计 和 ,那么么普通最小二二乘法就足够够用了。但在在回归分析中中,我们的目目的不仅仅是是获得 , 的估计值 , ,而是要对真真实 和 做出推推断。1、假定1:零零均值假定误差项ui 的的均值为零。对对于给定的XX 值,随机机误差项uii 的均值或或期望值为零零,即ui 的条件均值值为零,记为为E(ui / Xi )=00 这一假定的实际际意义为:凡凡是模型中不不显含的并因因而归属于uui 的因素素,对Y 的均值都都没有系统的的影响,正
16、的的ui 值抵消消了负的uii 值,它们们对Y 的平均影影响为零。2、假定2:同同方差假定同方差性或uii 的方差相相等。对所有有给定的Xii,ui 的方差差都是相同的的。就是说,ui 的条件方差是恒定的,即:其中,Var表表示方差。该假定表示对应应于不同Xii 值,ui 的方差都都是某个等于于 的正的常数数。3、假定3:无无自相关各个误差项之间间无自相关,uui 和ujj(ij)之间的的相关为零。i 和j 为两两次不同的观观测,Covv表示协方差差,该假定还还可以称为无无序列相关或或无自相关假假定。4、假定4:与与X不相关ui 和Xi 的协方差为为零或E(uui Xi)=0该假定表示误差差项
17、u 和解释变变量X 是不相关关的。也就是是说在总体回回归模型中,X 和u 对Y 有各自的影响。但是,如果X 和u 是相关的,就不可能评估他们各自对Y 的影响。5、假定5:无无完全的多重重共线性对于多元线性回回归模型,没没有完全的多多重共线性。就就是说解释变变量之间没有有完全的线性性关系。6、假定6:无无设定偏误至此,我们完成成了关于经典典线性回归模模型的基本假假定的讨论。上上述所有假定定都是针对总总体回归模型型而言的,而而不是关于样样本回归模型型的。三、最小二乘估估计量的性质质 高斯马尔可夫定定理1、高斯马尔尔可夫定理:在给定经典线性性回归模型的的假定下,最最小二乘估计计量是最佳线线性无偏估计
18、计量。第一,它是线性性的,即它是是回归模型中中的被解释变变量Y 的线性函数数。第二,它是无偏偏的,即它的的均值或期望望值等于其真真值,即第三,它在所有有这样的线性性无偏估计量量中具有最小小方差。具有有最小方差的的无偏估计量量叫做有效估估计量。2、普通最小二二乘估计量的的性质说明(1)线性性(2)无偏性虽然由不同的样样本得到的参参数估计值,可可能大于或小小于它们的真真实值,但平平均起来等于于它们的真实实值。在此要特别注意意:无偏性是 的抽样分布的的性质,并没没有告诉我们们从特定样本本中得到 的估计值值是什么,我我们希望得到到较好的样本本,那样就会会得到接近于于总体参数 的估计计值。但由于于是随机
19、获得得样本,就有有可能得到远远离总体参数数 的估估计值的较差差样本。并且且,我们无法法判定所得到到的样本是哪哪一种。(3)方差最小小1)最小二乘估估计的方差与与标准误普通最小二乘估估计量 的方差 代代表了估计参参数的估计精度。据方差定义,可可知: 据经典假定,且且E(uiuj)=0,ij故:此式是依赖于同方差和无序列相关假定的。同理,的方差为:影响估计精度的的因素为随机机误差项的方方差和Xi的总变异异。随机误差项的方方差越大,越大。因因为,影响YY 的不可观观测的因素变变异越大,要要准确地估计计就越难。另一方面,自变变量的变异越越大,估计的的精度就越高高。因为Xii 的变异性性增时,的方方差就
20、会减小小,就是说,解解释变量的样样本分布越分分散,就越容容易找出E(Y / XXi) 和Xi 间的关关系,即越容容易准确估计计。如果Xi没有什什么变化,就就难以准确地地确定E(YY/Xi)是是如何随着XXi的变化而而变化的。当当样本容量扩扩大时,Xii的总变异也也增加。因此此较大的样本本容量会产生生较小的的方方差。最小二乘估计的的标准误为 2)的最小二乘乘估计量的无偏估计量: 区分误差差与残差的概概念。在经典假定条件件下,可以证证明。的估计量为为,我们称其为为回归的标准准误。估计量量是对影响Y的不可观测测因素的标准准误的估计。就就是说,它估估计了把X 的影响排除除之后Y 的标准误误。3)可以证
21、明,在在满足经典假假定条件下,普普通最小二乘乘估计量是所所有线性无偏偏估计量中方方差最小的。四、判定系数RR2拟合优度的的度量 1、 表示实测的YY 值围绕其其均值的总变变异,称为总总平方和(TTSS)。 为来自解释变变量的回归平平方和,称为为解释平方和和(ESS)。 是围绕回归归线的Y值的变异,称称为残差平方方和(RSSS)。TSS=ESSS+RSS (44.45)这说明Y 的观观测值围绕其其均值的总变变异可分解为为两部分,一一部分来自回回归线,而另另一部分则来来自扰动项uui 。YXXiYiTSSRSSESS用TSS除式(44.45)的的两边,得2、定义R2为为: 或 上述定义的R22称为
22、判定系系数,它是对对回归线拟合合优度的度量量。就是说,R2测度了在Y 的总变异中由回归模型解释的那个部分所占的比例或百分比。据判定系数的定定义可知:00R21。3、相关系数RR与R2关系紧密密但概念上与与R2差异较大大的一个参数数是相关系数数,它测度了了两个变量之之间的关联度度。,也可据R的定义计算算从定义可以看出出-1R1。在回归分分析中,R22是一个比R更有意义的的度量,因为为R2告诉我们们在被解释变变量的变异中中,由解释变变量解释的部部分占怎样一一个比例,因因而对一个变变量的变异在在多大程度上上决定另一个个变量的变异异,提供了一一个总的度量量,而R则没有这种种作用。第四节 置信信区间与假
23、设设检验一、置信区间要判断对估计的的可靠性,可可设定区间,使使其包含的概概率为。即:,其中,。如果存在这这样一个区间间,就称设定定的区间为的的置信区间。称为置信系数或置信水平,而称为显著性水平,称为置信上限,称为置信下限。二、ui 正态态性假定及普普通最小二乘乘估计量和的性质1、ui 正态态性假定 在最小二乘估计计式中,是Yi 的线性性函数,从而而也就是uii 的线性函函数。要推断断的置信区间间,我们就必必须获得uii 的概率分分布。在回归归分析中,人人们常常假定定ui 服从正正态分布,即即每个ui 都是正态分分布的。2、ui 正态态假定下普通通最小二乘估估计量和的性质(1)它们是无无偏的。(
24、2)它们有最最小方差。(3)它们是一一致估计量。就就是说,随着着样本容量无无限地增大,估估计量将收敛敛到它们的真真值。(4)服从正态态分布(5)服从正态态分布(6)服从22(n-2)分布(7)Yi 服服从正态分布布三、回归系数 和 的置信区间间是显著性水平为为,自由度为为n2的t 分布的t 值,通常常称为显著水水平的临界值值。可以看出,的的置信区间的的宽度与估计计量,的标准误,成正比例。标标准误越大,置置信区间越宽宽。就是说,估估计量的标准准误越大,对对未知参数的的真值进行估估计的可靠性性越差。因此此,估计量的的标准误也被被用于测度估估计量的精度度, 就是说说用估计量去去测定真实的的总体值有多
25、多精确。95%的置信区区间意义:在在重复抽样中中,每1000个类似区间间有95个包含真真实的均值;四、假设检验1、检验回归系系数的显著性性t 检验H0:虚拟假设设或原假设H1:备择假设设一般地,可假设设为:原假设设H0:;备择假设H1:我们使用了t 分布对回归归系数进行假假设检验,因因此,该检验验程序称为tt 检验。如如果一个统计计量的值落在在拒绝域上,我我们称该统计计量是统计上上显著的。此此时,我们拒拒绝原假设;如果一个统统计量的值落落在接受域上上,我们称该该统计量是统统计上不显著著的。此时,我我们接受原假假设。t 检验决策规规则:(1)设定假设设原假设:备择假设:(2)计算原假假设条件下的
26、的t统计量(3)在给定显显著性水平的的条件下,查查t分布表得临临界值(4)判断如果 ,则拒绝原假假设 ,接接受备择假设设:如果,则不拒绝绝原假设2、t 检验的的相关问题 (1)显著性水水平临界值的大小取取决于显著性性水平,即犯犯第I类错误误的概率(错错误地拒绝了了真实的原假假设的概率)。 越小临界值 越大,犯第I类错误的概率越小。(2)实际显著著水平P值一般经济计量分分析中,都使使用事先给定定的显著性水水平。当我们们对给定的样样本,算出一一个检验统计计量(如t 统计量)的的值时,就可可据相应的统统计表,获知知得到等于或或大于该统计计量的概率,我我们称其为PP 值。P 值是假设检检验中的实际际显
27、著性水平平或犯第类错误的实实际概率。更更确切地讲,P 值是一个虚拟假设被拒绝的最低显著性水平。(3)“2倍tt ”和“5%P 值”简算法当样本容量n 较大时(n30),t 值只要大大于2.0,我们们就将回归系系数判定为显显著的。当进进行多元回归归时回归系数数较多,利用用这种方法非非常方便,不不需查t 分布表。同样,在5%的的显著水平下下,无论样本本容量多大,当当P 值小于5%时,即P0.05时,我我们就可判定定回归系数是是显著的。如果显著性水平平不是5%或样本较较小,则回归归系数的显著著性检验的临临界值就需据据t分布表来确确定,而不能能使用2或5%做临界水水平进行t 检验。第五节 回归归分析结
28、果的的报告与评价价一、回归分析结结果的报告二、回归分析结结果的评价第六节 回归归分析的应用用预测一、预测概述二、均值预测三、个值预测第三章 多元元线性回归模模型第一节 多元元回归模型的的定义一、含有两个解解释变量的多多元回归模型型其中,Yi 是是被解释变量量,X2i 和X3i 是解释变变量,ui是随机干干扰项,i 指第i 项观测。表表面上看,代代表X2和X3均取0时的Y的均值, 但这仅仅是是一种机械的的解释,实际际上是指所有有未包含到模模型中来的变变量对Y 的平均影影响。系数和为偏回归归系数,表示示在保持X33不变的条件件下,X2每变化一一个单位时,Y的均值的变化。经典线性回归模模型的假定条条
29、件如下:假定1:ui 零均值假定定 EE(ui|X2i, X3i)0对每个i 假定2:ui 无序列相关关假定 Cov(ui, uuj)0ij假定3:ui 同方差假定定 假定4:ui 与每一个解解释变量无关关 假定5:无设定定偏误假定6:解释变变量X之间无无完全的共线线性无共线性的含义义是,不存在在一组不全为为零的数和使得第二节 最小小二乘估计一、最小二乘估估计量 (5.16)如果使用普通最最小二乘法而而得到了式(5.16)的样本回归函数,我们就称其为:将Y 对X1,X2,Xk 进行了回归。我们的目的就是是得到式(55.16)中中的估计值,使使残差平方和和最小。二、判定系数RR2及调整的判判定系
30、数1、判定系数依依然为解释平平方和ESSS与总平方和和TSS的比值值,即:判定系数R2的的一个重要性性质是:在回回归模型中增增加一个解释释变量后,它它不会减少,而而且通常会增增大。即R22是回归模型型中解释变量量个数的非减减函数。所以,使用R22来判断具有有相同被解释释变量Y 和和不同个数解解释变量X的的回归模型的的优劣时就很很不适当。此此时,R2不能用于比比较两个回归归方程的拟合合优度。2、为了消除解解释变量个数数对判定系数数R2的影响,需需使用调整后后的判定系数数:式中,k 为包括截距项在内的模型中的参数个数。在二元回归模型中k3,在一元回归模型中k2。所谓调整,就是是指 的计算式中中的
31、和 都用它们的的自由度(nnk)和(n1)去除。3、调整的判定定系数 和 R2的关系为三、最小二乘估估计量的期望望值和方差1、偏回归系数数 的期期望值2、 的方方差和标准误误的期望值度量了了 的集集中趋势。而而 的方方差则度量了了 围绕绕其期望值的的集中程度,也也就是度量了了 的估估计精度。式中,为Xj的总样本变异;j2, 3, , k;为将Xj对所有其它解释变量(包括一个截距项)进行回归所得到的判定系数R2。(1)在满足经经典假定的条条件下,偏斜斜率系数估计计量的方差为为(2)将开方,则则得的标准误误:3、 的无无偏估计量为为四、最小二乘估估计量的性质质高斯马尔可夫夫定理:在多多元线性回归归
32、模型的经典典假定下,普普通最小二乘乘估计量分别别是的最佳线线性无偏估计计量。就是说说,普通最小小二乘估计量量,是所有线线性无偏估计计量中方差最最小的。第三节 多元元线性回归模模型的检验一、偏回归系数数的显著性检检验t 检验多元回归中的tt 检验决策策规则与一元元回归相同。二、回归模型的的整体显著性性检验F检验1、多元回归模模型的总体显显著性就是对对原假设,进行检验。2、检验的目的的就是判断被被解释变量YY 是否与X2, X3, , Xk 在整体体上有线性关关系。3、在一元回归归模型中,只只有一个解释释变量,对个个别回归系数数的t 检验就是是对回归模型型的整体显著著性检验。而而在多元回归归模型中
33、,可可以证明,对对偏回归系数数的逐一显著著性检验并不不能代替对回回归模型的整整体显著性检检验。4、对于多元线线性回归模型型在ui 服从正正态分布和原原假设 条条件下,变量量服从自由度为(k1)和(nk)的分布,即5、若原假设是是真实的,则则表明Y 与X2,X3,Xk 整体上上无线性关系系,Y 的变异全全部来源于干干扰项ui ,F 统计量的的值较小。6、F 检验决决策规则(1)设定假设设原假设 备择假设 不不全为 0,j 2, 3, , k(2)计算F 统计量 (3)在给定显显著性水平下下,查分布表可得得(4)判断如果,我们就拒拒绝H0,接受备择假假设H1;如果,则不拒绝绝H0。7、F 统计量量
34、与判定系数数R2 的关系系:统计量与R2是是同向变化的的。F 检验即是是对回归模型型整体显著性性的检验,也也是对判定系系数R2的一个显显著性检验。第四节 回归归模型的函数数形式讨论如下四种形形式的回归模模型。1对数线性模模型2半对数模型型3双曲线模型型4多项式模型型一、对数线性模模型1、 (5.51)该模型中LnYYi 对 , 是线性性关系,LnnYi对LnXi也是是线性关系。该该模型可称为为对数对数线性模模型,简称为为对数线性模模型。令 , 则则式(5.551)可表达达为:2、对数线性模模型的优点在在于:(1)对数线性性模型中斜率率系数度量了了一个变量(Y)对另一个变量(X)的弹性。(2)斜
35、率系数数与变量X,Y的测量单位位无关,其结结果值与X,Y的测量单位位无关。(3)当Y 0时,使使用对数形式式LnY比使使用水平值YY作为被解释释变量的模型型更接近经典典线性模型。大大于零的变量量,其条件分分布常常是有有异方差性或或偏态性;取取对数后,虽虽然不能消除除这两方面的的问题,但可可大大弱化这这两方面的问问题。(4)取对数后后会缩小变量量的取值范围围。使估计值值对被解释变变量或解释变变量的异常值值不敏感。3、对数线性模模型的经验法法则对于何时取对数数并不存在一一个固定模式式,但有一些些经验法则。(1)对于大于于0的数量变量量,通常均可可取对数。例例如,需求量量、价格、工工资等。(2)以年
36、度量量的变量,如如受教育年数数、工龄、年年龄等则通常常以其原有形形式出现。(3)以比例或或百分比度量量的变量,如如失业率、通通货膨胀率、犯犯罪率等变量量即可使用原原形式也可使使用对数形式式。但两种使使用方法中参参数的意义不不同。(4)使用对数数时,变量不不能取0或负负值。二、半对数模型型1、线性到对数数模型:被解释变量为对对数形式,解解释变量为线线性形式,称称为线性到对对数的半对数数模型。斜率系数的含义义为:解释变变量X绝对量改变变一个单位时时,被解释变变量Y 的相对改改变量。即2、对数到线性性模型:测度解释变量的的相对改变量量对被解释变变量的绝对改改变量的影响响,我们就需需要使用解释释变量是
37、对数数形式,被解解释变量是线线性形式的回回归模型。斜率系数的含义义为解释变量量X 相对量改改变1个单位位时,被解释释变量Y的绝对变化化量。当 0.0011%时, ,即当解释释变量X增加1%,被解释释变量Y增加的绝对对量为0.001 。三、倒数模型当解释变量以倒倒数形式出现现时的模型称称为倒数模型型或双曲线模模型。四、多项式模型型 称为二二次函数或二二次多项式。 称为三三次函数或三三次多项式。第五节 多元元回归模型的的设定偏误一、正确的多元元回归模型1、模型中只包包含关键变量量。就是说所所选定的模型型是最简便的的。模型是对现实经经济系统的抽抽象。一个模模型应尽量简简单,我们应应在设定模型型时只引
38、进抓抓住现实本质质的关键变量量,把影响微微弱的变量放放到干扰项uu中去。2、模型参数可可识别。对于于给定的一组组数据,估计计的参数具有有唯一值。3、较高的拟合合优度。4、估计的回归归系数与经济济理论一致。二、多元回归模模型的设定偏偏误主要包括括以下三种:1、回归模型中中包含了无关关解释变量后果:1)有误误模型的参数数最小二乘估估计量均无偏偏2) 的方方差无必要地地增大,降低低估计的精度度。2、回归模型中中遗漏了重要要解释变量后果:1) 有偏误,而而且不论样本本多大,偏误误都不会消失失。2) 不能能正确地估计计3)对于所估计计的参数的统统计显著性,容容易导出错误误的结论。3、回归模型中中的函数形
39、式式设定偏误函数形式的设定定偏误有多种种多样,我们们在选择模型型的函数形式式时必须谨慎慎小心,而这这又是一个探探索和改进的的过程,我们们只能通过不不断的尝试来来找到最恰当当的函数形式式。第四章 违背背经典假定的的回归模型在这一章里将重重点讨论模型型中出现了违违背经典假定定的几种情况况时的诊断及及解决办法。异方差: 在在截面数据时时重点关注异异方差!序列相关多重共线性第一节 异方方差性一、 什么是异方差: 当时异方差性:在线线性模型的基基本假定中,关关于方差不变变的假定不成成立,其他假假定不变的情情形称为异方方差性。实际问题是非常常错综复杂的的,因而在建建立实际问题题的回归分析析模型时,经经常会
40、出现某某一因素或一一些因素随着着解释变量观观测值的变化化而对被解释释变量产生不不同的影响,导导致随机误差差项产生不同同方差。引起异方差的原原因还有很多多,如模型中中省略了重要要的解释变量量,模型的函函数形式设定定不准确等都都容易产生异异方差。一般般情况下样本本数据为截面面数据时容易易产生异方差差性。二、 异方差有什么后后果当模型中存在异异方差时,参参数的方差将将大于在同方方差条件下的的方差。如果果用普通最小小二乘法估计计参数,将出出现低估的真真实方差的情情况。进一步步将导致回归归系数的检验验值高估,可可能造成本来来不显著的某某些回归系数数变成显著。这这将给回归方方程的应用效效果带来一些些影响。
41、当模型中存在异异方差时,普普通最小二乘乘估计存在以以下问题:1、参数估计量量虽是无偏的的,但不是最最小方差线性性无偏估计根据经典线性回回归中关于参参数估计量的的无偏性和有有效性的证明明过程,可以以看出,当线线性回归模型型出现异方差差性时,其普普通最小二乘乘法参数估计计量仍然具有有无偏性,但但不具有有效效性。而且,在大样本本情况下,参参数估计量也也不具有渐近近有效性,这这就是说参数数估计量不具具有一致性。2、参数的显著著性检验失效效在经典线性回归归模型中,关关于变量的显显著性检验构构造了t 统计量,在在该统计量中中包含有随机机误差项共同同的方差,并并且该t 统统计量服从自自由度为(nn-k)的t
42、 分布。如如果出现了异异方差性,tt 检验就失失去意义。采采用其他检验验也是如此。3、回归方程的的应用效果极极不理想,或或者说模型的的预测失效。一方面,由于上上述后果,使使得模型不具具有良好的统统计性质;另另一方面,在在预测值的置置信区间中也也包含有随机机误差项共同同的方差。所所以,当模型型出现异方差差性时,它的的预测功能失失效。三、 异方差怎么检验验1、残差图分析析法:残差图分析析法是一种直直观、方便的的分析方法。一般情况下,当当回归模型满满足所有假定定时,以eii 为纵坐标标的残差图上上的n 个点散布布应是随机的的、无任何规规律。2、戈德菲尔德德匡特检验验(样本分段段比检验)首先将样本按某
43、某个解释变量量的大小顺序序排列,并将将样本从中间间截成两段;然后各段分分别用普通最最小二乘法拟拟合回归模型型,并分别计计算各段的残残差平方和。该统计量服从自由度为(n1-k)和(n2-k)的分布。在给定的显著性性水平之下,若若此统计量临界值则可认认为有异方差差的存在。3、戈里瑟(GGlejseer)检验用残差绝对值 对每个个解释变量建建立各种回归归模型,如等等,并检验回回归系数是否否为。设原假设为 ,备择假设为为 ,应用用t检验判断,如如果 ,则有有异方差。这这种方法不仅仅能检验出模模型中存在的的异方差,而而且把异方差差的表现形式式找出来便于于后面改进时时使用。4、怀特检验用残差平方 对所有解
44、解释变量及其其平方项和交交叉乘积项 进行线性回归,并并检验各回归归系数是否为为。怀特检验步骤如如下:(1)使用普通通最小二乘法法估计模型,并并获得残差eei(2)做如下的的辅助回归:就是将残差eii 的平方对所有有的解释变量量及解释变量量的平方与交交叉积回归,求求这个辅助回回归的判定系系数R2。(3)辅助回归归的R2乘以样本本容量n,渐近地服服从自由度为为辅助回归中中解释变量个个数r(不包括常常数项)的xx2分布,即即(4)如果 大大于选定显著著性水平的临临界 值,则则有异方差。如如果不大于临临界 ,则则无异方差,即即在辅助回归归中 。软件中看后面的的伴随概率(PP值),P值值5% 则则显著,有异方差。四、 异方差怎么处理理加权最小二乘法法通过加权变换使使原模型中的的异方差误差差项转换为同同方差误差项项,使加权变变换后的模型型满足最小二二乘法的假定定,从而使用用普通最小二二乘法估计参参数,这种方方法称为加权权最小二乘法法。1、 已知知时