《计量经济学入门优秀PPT.ppt》由会员分享,可在线阅读,更多相关《计量经济学入门优秀PPT.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章第一章 什么是计量经济学什么是计量经济学 1.1 1.1计量经济学的由来计量经济学的由来 一、计量经济学的由来一、计量经济学的由来 西方发达资本主义国家经济危机爆发后,在西方发达资本主义国家经济危机爆发后,在众多经济学家对经济现象众多经济学家对经济现象“质质”的相识相当统一的相识相当统一后,部分经济学家起先用数量分析起先探究经济后,部分经济学家起先用数量分析起先探究经济问题,即从经济现象的问题,即从经济现象的“量量”方面起先探讨。方面起先探讨。“二战二战”后,统计学中的回来分析方法被广泛后,统计学中的回来分析方法被广泛应用到对经济指标的预料中,还有众多通积分和应用到对经济指标的预料中,还
2、有众多通积分和检验方法的引入。检验方法的引入。上述两方面的结合,形成了一门新的学问上述两方面的结合,形成了一门新的学问计量经济学。计量经济学是依据经济理论模型,计量经济学。计量经济学是依据经济理论模型,收集实际数据,用统计学的方法来对经济数据进收集实际数据,用统计学的方法来对经济数据进行处理,验证理论模型中变量之间的关系。行处理,验证理论模型中变量之间的关系。1.1计量经济学的由来 一、计量经济学的由来 “计量经济学”一词,最早是由挪威经济学家弗里希(R.Frisch)在1926年仿照“生物计量学”一词提出的。1930年12月29日成立了国际计量经济学学会在美国成立。1933年正式出版国际性学
3、术刊物计量经济学。标记着计量经济学作为一个独立的学科,正式诞生了。1.1计量经济学的由来 二、计量经济学的含义计量经济学的含义是对经济的测度,但是并不是全部经济现象的测度问题都属于计量经济学的探讨范围。第一章第一章 什么是计量经济学什么是计量经济学1.2计量经济学的特点一、计量经济学的定义计量经济学是以经济理论和阅历事实为依据,运用数学和统计学的方法,探讨具有随机性特征的经济变量关系和经济活动规律计量方法论及其运用的一门经济学分支学科。1.2计量经济学的特点二、计量经济学的特点 计量经济学的特点是留意经济变量关系的随机性特征,试图借助统计学的方法建立经济变量之间的定量关系。计量经济学运用的三个
4、前提:a、经济理论基础上建立起来的经济数学模型;b、收集精确的实际经济数据;c、拥有运算速度快、记忆容量大的计算机和统计软件。n n 1.3计量经济学的回来分析n n一、回来分析的含义n n 回来分析,英文名称:regression analysis 定义:探讨一个随机变量Y对另一个(X)或一组(X1,X2,Xk)变量的相依关系的统计分析方法。回来分析(regression analysis)是确定两种或两种以上变数间相互依靠的定量关系的一种统计分析方法。回来分析依据涉及的自变量的多少,可分为一元回来分析和多元回来分析;依据自变量和因变量之间的关系类型,可分为线性回来分析和非线性回来分析。1.
5、3 1.3计量经济学的回来分析计量经济学的回来分析二、回来分析的主要内容为:二、回来分析的主要内容为:从一组数据动身确定某些变量之间的定量关系式,从一组数据动身确定某些变量之间的定量关系式,即建立数学模型并估计其中的即建立数学模型并估计其中的 未知参数。估计参未知参数。估计参数的常用方法是最小二乘法。数的常用方法是最小二乘法。对这些关系式的可信程度进行检验。对这些关系式的可信程度进行检验。在很多自变量共同影响着一个因变量的关系中,在很多自变量共同影响着一个因变量的关系中,推断哪个(或哪些)自变量的影响是显著的,哪推断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自
6、变些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常量选入模型中,而剔除影响不显著的变量,通常用逐步回来、向前回来和向后回来等方法。用逐步回来、向前回来和向后回来等方法。利用所求的关系式对某一生产过程进行预料或限利用所求的关系式对某一生产过程进行预料或限制。回来分析的应用是特别广泛的,统计软件包制。回来分析的应用是特别广泛的,统计软件包使各种回来方法计算特别便利。使各种回来方法计算特别便利。1.3计量经济学的回来分析三、计量经济学的回来分析 回来分析是计量经济学的主要方法,最初是由一位叫弗朗西斯高尔顿的学者提出,主要是用实际数据来说明变量之间的关系。计量经济学
7、中的变量有自变量和因变量之分,其中的自变量在计量经济学中常称为说明变量,因变量称为被说明变量,被说明变量是因为其他因素的变更而变更的变量。说明变量是在特定环境中自身起作用且会影响被说明变量的变量。计量经济学中被说明变量一般放在等式的左边,说明变量一般放在右边。1.4计量经济学的数据问题数据的问题主要是考虑数据的类型。常见的数据分为三类:横截面数据、时间序列数据和面板数据。横截面数据是指某一时间对不同对象进行视察调查所取得的数据。时间序列数据是指对同一对象在不同时间连续视察调查所取得的数据。面板数据:同一组样本对象在连续几个时期被采样的数据。采集数据一般有二种方法:第一手资料和二手资料。数据资料
8、主要来源于中国统计年鉴、中国经济统计年鉴等。n n 1.4 1.4计量经济学的数据问题计量经济学的数据问题n n例例1 1 截面数据截面数据 2010 2010年年7 7月月 排行排行 城市城市 新居均价新居均价(元元/平方米平方米)n n1 1 杭州市杭州市 25840 2 25840 2 北京市北京市 22310 3 22310 3 上海市上海市 19168 4 19168 4 温州市温州市 18854 5 18854 5 三亚市三亚市 18319 6 18319 6 深圳市深圳市 16978 7 16978 7 宁宁波市波市 13438 8 13438 8 广州市广州市 12560 9
9、12560 9 南京市南京市 12016 10 12016 10 舟舟山市山市 10500 47 10500 47 南昌市南昌市 5573 70 5573 70 九江市九江市 4771 4771 n n例例2 2 时间序列数据时间序列数据 近十年中国近十年中国GDPGDP数据数据1998 1998 84402.384402.3亿元亿元1999 88479.21999 88479.2亿元亿元2000 98000.52000 98000.5亿亿元元2001 108068.22001 108068.2亿元亿元2002 119095.72002 119095.7亿元亿元2003 2003 135174
10、.0135174.0亿元亿元2004 159586.72004 159586.7亿元亿元2005 184739.12005 184739.1亿亿元元2006 211923.02006 211923.0亿元亿元2007 249530.02007 249530.0亿元亿元2008 2008 n n 1.4计量经济学的数据问题例3 面板数据 中国部分省份人均GDP状况 单位(元)n n1.5计量经济学的学习和应用n n学好计量经济学必需学会多“试验”,即动手收集实际数据,对数据进行处理和分析。n n应用计量经济学的一般步骤:n n1简介(Introduction);2文献回顾(Literature
11、review);3理论模型和探讨方法(Model and research method);4数据(data);5回来结果分析(Analysis results);6结论(Conclusion);7参考文献(Reference).其次章其次章 最小二乘法最小二乘法n n回来分析是计量经济学中最常用来处理数据、进回来分析是计量经济学中最常用来处理数据、进行估计和验证模型的基本方法。这种探讨的一般行估计和验证模型的基本方法。这种探讨的一般步骤是:首先,要确定所探讨的问题(因变量),步骤是:首先,要确定所探讨的问题(因变量),并依据经济理论,找出与该问题相关的有影响力并依据经济理论,找出与该问题相关
12、的有影响力的经济因素(自变量),并建立因变量与自变量的经济因素(自变量),并建立因变量与自变量的关系式(经济模式),然后,依据科学的方法的关系式(经济模式),然后,依据科学的方法收集相应的变量的实际数据,接下,依据实际数收集相应的变量的实际数据,接下,依据实际数据用回来分析的方法来估计经济模式中的参数,据用回来分析的方法来估计经济模式中的参数,并进行验证,最终,对所探讨的问题作出结论。并进行验证,最终,对所探讨的问题作出结论。其中最经典的方法是最小二乘法。其中最经典的方法是最小二乘法。n n2.12.1计量经济学理论模型的建立计量经济学理论模型的建立n n在对经济现象有了初步的了解后,可以借助
13、变量在对经济现象有了初步的了解后,可以借助变量来表达经济现象的数量关系。先用简洁的回来模来表达经济现象的数量关系。先用简洁的回来模型来说明问题,简洁模型是指两个变量的线性模型来说明问题,简洁模型是指两个变量的线性模型,其中一个是因变量,一个是自变量,常称作型,其中一个是因变量,一个是自变量,常称作一元线性回来模型,用数学式子表示为一元线性回来模型,用数学式子表示为 ,在这个式子中,在这个式子中,Y Y是因变量,是因变量,X X是自变量,式是自变量,式中中 、是参数,是参数,是扰动项或随机项。其对应的是扰动项或随机项。其对应的一元线性回来方程是一元线性回来方程是 。X X是自己变动,是自己变动,
14、Y Y随随X X的变动而变动,式中的的变动而变动,式中的 、是参数,是参数,是截是截距,即当距,即当X=0X=0时时Y Y的值;的值;是斜率,或叫变更率,是斜率,或叫变更率,是对是对X X的一阶导数,依据的一阶导数,依据 的的 方向()和大小方向()和大小可以推断可以推断Y Y随随X X变动的方向和程度,其中变动的方向和程度,其中 的正负的正负表示定性的关系,既有正方向影响,即表示定性的关系,既有正方向影响,即Y Y随随X X的增的增加而增加,也有反方向的影响,即加而增加,也有反方向的影响,即Y Y随随X X的增加而的增加而减小;而减小;而 的确定值则表示定量的关系。的确定值则表示定量的关系。
15、n n2.12.1计量经济学理论模型的建立计量经济学理论模型的建立n n学习计量经济学时,不是找几个学习计量经济学时,不是找几个“经济变量经济变量”凑在凑在一起就会成为模型,而是要对因变量和自变量以一起就会成为模型,而是要对因变量和自变量以及其相互关系进行理解,应当留意模型中的变量及其相互关系进行理解,应当留意模型中的变量确定要有因果关系。下面对经济模型举例:假如确定要有因果关系。下面对经济模型举例:假如要探讨人们的消费状况,消费额是因变量,什么要探讨人们的消费状况,消费额是因变量,什么因素会对消费额产生关键性的影响呢?依据经济因素会对消费额产生关键性的影响呢?依据经济理论,人们的收入是最关键
16、因素,这样模型就写理论,人们的收入是最关键因素,这样模型就写成这样:成这样:,其中,其中C C是指消费额,是指消费额,Y Y是收入。是收入。n n当然,上面的是最简洁的消费模型,当人们消费当然,上面的是最简洁的消费模型,当人们消费还取决于其他因素,如:通货膨胀率、生命周期还取决于其他因素,如:通货膨胀率、生命周期等,这样方程可以写成:等,这样方程可以写成:,其中,其中C C、Y Y同上,同上,r r通货膨胀率,通货膨胀率,N N年龄。年龄。n n2.22.2实际数据的收集实际数据的收集n n当建立了理论上的关系模型后,比方说,当建立了理论上的关系模型后,比方说,n n,就要从实际中收集有关消费
17、和收入的数据,要收集两个,就要从实际中收集有关消费和收入的数据,要收集两个变量变量C C、Y Y的数据,要对探讨对象中的数据,要对探讨对象中n n个个体进行视察,从个个体进行视察,从而收集到而收集到n n组数据,每组数据叫一个组数据,每组数据叫一个“样本样本”,每个样本对应,每个样本对应于一对于一对C C和和Y Y值,计作(值,计作(),),i=1,2,3i=1,2,3,常排列成矩阵常排列成矩阵n n n n这样,回来分析模型可以表示为这样,回来分析模型可以表示为n ni=1,2,3i=1,2,3,其中,其中 是第是第i i个样本的实际值个样本的实际值 与估计值与估计值 之间之间的差异,也叫估
18、计误差。的差异,也叫估计误差。n n 2.22.2实际数据的收集实际数据的收集 有关有关n n组实际数据对的取得,常常要从中国组实际数据对的取得,常常要从中国统计年鉴、中国经济统计年鉴、世界统计年鉴、中国经济统计年鉴、世界经济统计年鉴以及各行业、各地区的统计年经济统计年鉴以及各行业、各地区的统计年鉴中找寻。鉴中找寻。19892002 19892002年中国人均可支配收入与人均消费状年中国人均可支配收入与人均消费状况(元)况(元)n n2.3最小二乘法n n最小二乘法是德国著名数学家高斯独创的,它是回来分析中最为普遍的方法。下面举例简洁线性方程来探讨最小二乘法是如何估算模型参数的。n n 给定被
19、说明变量Y和说明变量X,同时给出两个变量的n个数据组()、()、()();再假设依据回来分析方法估算出的线性方程式:。明显估计出来的线性方程在坐标中是一条直线。通常实际数据应当是落在在这条直线的两侧或线上。这样实际数据的Y值会与估计的 之间会不同,这种差异叫做误差项,用 表示,即 ,于是回来模型表为 。具体到每一组数据而言,。为了希望得到一个最精确的回来方程,等价于要求误差项最小。因为实际数据的落点在估计直线的四周,有上有下,也可能在直线上。于是试图是找到这样一条直线,它到每一个实际落点的距离和最小。由于距离大小正负值的影响,这里用误差项的平方值来测定其他确定距离,即 。这样其误差平方和是 ,
20、等价于寻求 的最小值。用全微分的方法求极值。n n2.3最小二乘法n n下面运用极值的方法求出两个参数。n n对 、求一阶导数并令其等于0,n n即有:n n n n解开这个正规方程,可以得出:n n对 、求二阶导数,有 n n n n明显满足数学上最小值的条件,所求的结果是最小值,这就是最小二乘法。n n2.3最小二乘法n n 对于上述模型中的误差项有很强的假设条件,即一元线性回来模型的假设:一是每个误差项必需是随机的,其误差项期望等于0,即 ;二是误差的相等是有限的,即 ;三是误差之间必需是相互独立的,即 ;四是误差项与变量之间必需是无关的,即 ;五是误差项听从零均值、同方差的正态分布,即
21、 。满足上述14项假设条件,即是满足高斯马尔科夫定理,所估计出来的参数方程是最好的、线性的、无偏差的。n n2.42.4最小二乘法应用实例最小二乘法应用实例n n计量经济学中的回来分析主要是依据经济理论的计量经济学中的回来分析主要是依据经济理论的数学模型和实际的经济数据来计算出符合实际的,数学模型和实际的经济数据来计算出符合实际的,可应用经济分析的参数方程。可应用经济分析的参数方程。n n例题:估算某地区居民的消费函数例题:估算某地区居民的消费函数n n 经济理论:依据凯恩斯的确定收入假设经济理经济理论:依据凯恩斯的确定收入假设经济理论,人们的消费额取决于他们的收入。也就是说论,人们的消费额取
22、决于他们的收入。也就是说消费与收入有线性关系,收入越多消费也越多,消费与收入有线性关系,收入越多消费也越多,收入越少消费也越少。收入越少消费也越少。n n 数学模型:设消费是因变量,收入是自变量,数学模型:设消费是因变量,收入是自变量,线性模型是线性模型是 ,这里,这里C C是因变量消费额,是因变量消费额,Y Y是自变量收入(常用可支配收入)。模型中两是自变量收入(常用可支配收入)。模型中两个参数是个参数是 、,是误差项。要将模型中的是误差项。要将模型中的两个参数、估计出来,必须要借助于多组消费额两个参数、估计出来,必须要借助于多组消费额(C C)、收入()、收入(Y Y)的数据。下面是对某区
23、域二十)的数据。下面是对某区域二十位消费者做的实际经济状况的调查,所收集到的位消费者做的实际经济状况的调查,所收集到的数据见下表。数据见下表。n n2.42.4最小二乘法应用实例最小二乘法应用实例表表2.41 2.41 某区域消费与收入的调查样本某区域消费与收入的调查样本n n2.42.4最小二乘法应用实例最小二乘法应用实例n n关于如何运用关于如何运用X X、Y Y的值计算两个参数见下表。的值计算两个参数见下表。n n表表2.42 2.42 关于关于X X、Y Y变量值计算状况变量值计算状况n n2.4最小二乘法应用实例运用上述数据可以计算出上述两个参数运用上述数据可以计算出上述两个参数这样
24、,估计的模型写成:这样,估计的模型写成:这样,估计的方程写成:这样,估计的方程写成:第三章第三章 简洁回来模型及回来结果的简洁回来模型及回来结果的检验检验简洁回来模型,即一元线性回来模型,是指一个因变量和一个自变量的线性模型。回来分析的主要步骤是:首先是建立经济模型,然后依据模型中的变量收集数据,对数据进行分析处理,得出一元线性回来方程,最终还要对求出的参数进行检验,主要是估计参数的统计检验和估计参数方程的方差分析以及归回结果的拟合优度检验。n n3.1模型的建立n n 现在来探讨一个夏季气温变更与饮料销售量的关系。依据常理说,气温越高,人们越感到不舒适,越想通过喝冷饮来防暑降温,从而调整自身
25、的感觉,也就是说,气温越高,冷饮销售量应越大要证明这个“理论”没有多大意义。但对于一个饮料生产商或批发商来说,假如有个市场需求的精确预料,还是很有意义的。n n3.1模型的建立气温(气温()销量(万)销量(万)10 13 15 18 20 24 26 27 28 10 13 15 18 20 24 26 27 28 29 29 70 73 85 93 98 100 130 134 139 140 15529 29 70 73 85 93 98 100 130 134 139 140 155气气温(温()销量(万)销量(万)30 30 30 32 33 34 38 38 30 30 30 32
26、33 34 38 38 40158 160 169 178 180 180 182 198 20040158 160 169 178 180 180 182 198 200首先,做个气温(自变量)首先,做个气温(自变量)X X和销量(因变量)和销量(因变量)Y Y之间的散之间的散点图,如下图:点图,如下图:n n3.1模型的建立n n图中,销量用纵轴表示,气温用横轴表示,可以看到,因变量与自变量之间存在比较清晰的线性关系。这样可用线性模型表示,设 。n n应用上述21个样本数据可以得到 。因而回来方程 。运用这个估计方程对将来做预料,因而可以确定,假如气温提高1,销量就会增加4.881个单位,
27、即增加48810瓶。n n3.23.2估计参数的统计意义估计参数的统计意义n n算出模型中的参数后,任务并没有完成。还要对算出模型中的参数后,任务并没有完成。还要对上面的回来结果进行分析。其中重要的一步是方上面的回来结果进行分析。其中重要的一步是方程中的每个参数是否有统计意义。为了计算参数程中的每个参数是否有统计意义。为了计算参数的的“t Statistics”“t Statistics”的值。下面从一元线性回来模型的值。下面从一元线性回来模型讲起。讲起。n n给定给定 ,其中,其中 是误差项,这个误是误差项,这个误差项的期望值等于零,其模型的估计方差是:差项的期望值等于零,其模型的估计方差是
28、:n n说明:一般的方差计算公式是说明:一般的方差计算公式是n n这里运用(这里运用(n-2)n-2)是因为有是因为有2 2个参数个参数 、。n n3.23.2估计参数的统计意义估计参数的统计意义n n对模型的方差开平方,取其算术平方根,记作对模型的方差开平方,取其算术平方根,记作s s,它被定义,它被定义为估计的标准误差(为估计的标准误差(standard error of estimate)standard error of estimate)或回来的标准或回来的标准误差(误差(standard error of regression standard error of regressio
29、n)。下面来计算估计参数)。下面来计算估计参数 的标准误差的标准误差 (standard error of the estimate coefficient)standard error of the estimate coefficient)。n n先算出其方差先算出其方差 ,那么,那么,的标准误差是的标准误差是 ,那么,那么 的统计检验值(的统计检验值(t Statistics t Statistics)就)就n n n n是是 。n n n n再来计算估计参数再来计算估计参数 的标准误差的标准误差 (standard error of the standard error of the
30、estimate coefficient)estimate coefficient)。n n先算出其方差先算出其方差 ,那么,那么,的标准误差是的标准误差是 ,那么,那么 的统计检验值(的统计检验值(t Statistics t Statistics)就)就n n是是 。n n n n3.23.2估计参数的统计意义估计参数的统计意义n n 回到前面的例子上,可以将参数的统计指标列在回到前面的例子上,可以将参数的统计指标列在估计方程的下面:估计方程的下面:n n (1.128)(18.95)(1.128)(18.95)n n括号中的数值就是相对应的估计参数的统计指标括号中的数值就是相对应的估计参
31、数的统计指标(t statt stat等于等于Coefficient Coefficient 除以除以Standard Error)Standard Error)。下面对。下面对这两个参数进行假设检验。假设参数都等于零,因这两个参数进行假设检验。假设参数都等于零,因为参数的方差未知,运用为参数的方差未知,运用t t检验,因为样本的个数检验,因为样本的个数是是2121,那那么其自由度是,那那么其自由度是2020,假如选择置信区间定,假如选择置信区间定为为95%95%,那么其误差容许范围在,那么其误差容许范围在5%5%的范围内(也的范围内(也称显著性水平),从称显著性水平),从t t统计表中查出自
32、由度是统计表中查出自由度是2020,显著性水平是显著性水平是5%5%对应的对应的t t统计量是统计量是1.7251.725。将查表所。将查表所得的值与计算所得的值进行对比,以便接受参数是得的值与计算所得的值进行对比,以便接受参数是否等于零。否等于零。n n3.23.2估计参数的统计意义估计参数的统计意义n n 假如计算的值大于查表的值,则有假如计算的值大于查表的值,则有95%95%的把握认的把握认定:估计出来的参数不等于零;否则相反。在上定:估计出来的参数不等于零;否则相反。在上例中,气温前面的参数的例中,气温前面的参数的t t统计量统计量18.9518.95明显大于查明显大于查表的表的1.7
33、251.725,因此,有,因此,有95%95%的把握认定参数的把握认定参数 不等不等于零。这样这个参数是有意义的。因而,有理由于零。这样这个参数是有意义的。因而,有理由信任:当气温上升一度时,市面上对饮料的需求信任:当气温上升一度时,市面上对饮料的需求会增加会增加4.8814.881万瓶。万瓶。n n 另外,参数的估计另外,参数的估计“失误率失误率”也是有用的。在检也是有用的。在检验参数的统计意义时,设定参数的失误率容许范验参数的统计意义时,设定参数的失误率容许范围是围是5%5%,那么,假如参数的估计失误率小于,那么,假如参数的估计失误率小于0.050.05,它们就有统计意义,否则相反。,它们
34、就有统计意义,否则相反。n n3.23.2估计参数的统计意义估计参数的统计意义n n单个参数统计检验的一般思路:单个参数统计检验的一般思路:n n1 1、建立假设:、建立假设:n n2 2、构造统计量:、构造统计量:n n3 3、计算、计算t t统计量的值;统计量的值;n n4 4、依据题意,设定好置信系数,通过、依据题意,设定好置信系数,通过t t统计量表,统计量表,查查t t统计量的上阕值;统计量的上阕值;n n5 5、比较计算值与查表的上阕值,若计算值大于、比较计算值与查表的上阕值,若计算值大于查表值,接受假设此参数不等于零,否则接受此查表值,接受假设此参数不等于零,否则接受此参数等于零
35、。参数等于零。n n 以上是以以上是以 的检验作为例子,对于的检验作为例子,对于 也是一也是一样的步骤。(说明:之所以实行样的步骤。(说明:之所以实行t t统计量是因为此统计量是因为此参数的方差是未知的。)参数的方差是未知的。)n n3.33.3估计参数方程的方差分析(估计参数方程的方差分析(ANOVAANOVA)n n对于回来分析得出的结果作进一步的分析,就对于回来分析得出的结果作进一步的分析,就是对估计参数方程的方差分析,英文叫是对估计参数方程的方差分析,英文叫Analysis Analysis of variance(ANOVAof variance(ANOVA)。下面进行方差分析。设)
36、。下面进行方差分析。设n n 这样这样 。将上。将上面的这个等式的两边同时减去面的这个等式的两边同时减去 ,得到:,得到:n n 等式的右边是每个样本值等式的右边是每个样本值与其平均值的差,也就是真实误差。再将等式与其平均值的差,也就是真实误差。再将等式的两边同时进行平方后加总,有的两边同时进行平方后加总,有 :n n n n这里这里 n n3.33.3估计参数方程的方差分析(估计参数方程的方差分析(ANOVAANOVA)n n对于上面的等式定义对于上面的等式定义 为方差为方差总和;定义总和;定义 为方差的回来平方和,为方差的回来平方和,也叫说明平方和;定义也叫说明平方和;定义 误差平方误差平
37、方和,也叫未说明平方和。于是和,也叫未说明平方和。于是 TSS=RSS+ESS TSS=RSS+ESS,即方差总和等于说明平方和与未说明平方和的,即方差总和等于说明平方和与未说明平方和的加总。说明平方和的自由度被规定为模型中的自加总。说明平方和的自由度被规定为模型中的自变量的个数,用变量的个数,用k k来表示,未说明平方和的自由来表示,未说明平方和的自由度被规定为样本数减去自变量数再减去度被规定为样本数减去自变量数再减去1 1,用,用(n-(n-k-1)k-1)来表示。下面构造来表示。下面构造F F统计量来对模型的回来统计量来对模型的回来结果做整体的假设检验。结果做整体的假设检验。F F统计量
38、主要是用来说统计量主要是用来说明两个变量的对比的检验的。明两个变量的对比的检验的。n n3.33.3估计参数方程的方差分析(估计参数方程的方差分析(ANOVAANOVA)n n整体参数统计检验的一般思路:整体参数统计检验的一般思路:n n1 1、建立假设:、建立假设:n n2 2、构造统计量:、构造统计量:n n3 3、计算、计算F F统计量的值;统计量的值;n n4 4、依据题意,设定好置信系数,通过、依据题意,设定好置信系数,通过F F统计量表,统计量表,查查F F统计量的上阕值;统计量的上阕值;n n5 5、比较计算值与查表的上阕值,若计算值大于查、比较计算值与查表的上阕值,若计算值大于
39、查表值,接受假设此整体参数不同时等于零,否则接表值,接受假设此整体参数不同时等于零,否则接受此整体参数都等于零。受此整体参数都等于零。n n n n3.33.3估计参数方程的方差分析(估计参数方程的方差分析(ANOVAANOVA)n n依据上述的思路,在作出假设后,计算依据上述的思路,在作出假设后,计算F=Explained Variance/Unexplained VarianceF=Explained Variance/Unexplained Variancen n=Regression Variance/Residual Variance=359.1=Regression Varianc
40、e/Residual Variance=359.1n n给出给出5%5%的统计误差,查的统计误差,查F F统计量表可知,统计量表可知,n n这样可以得出有这样可以得出有95%95%的把握来否定原假设,也就的把握来否定原假设,也就是说,所估计出来的参数值不会同时等于零。是说,所估计出来的参数值不会同时等于零。n n3.43.4回来结果的说明回来结果的说明n n在回来模型结果中还应当留意一个统计量。在前在回来模型结果中还应当留意一个统计量。在前面的讲解并描述中,始终留意面的讲解并描述中,始终留意TSSTSS与与RSSRSS、ESSESS的的关系,从中可知:假如关系,从中可知:假如RSSRSS占占T
41、SSTSS的比重越大,说的比重越大,说明这个模型模拟得越好。现定义这个统计量为判明这个模型模拟得越好。现定义这个统计量为判定系数,记作定系数,记作 。n n判定系数的数值落在判定系数的数值落在0101。一接近。一接近1 1,认为这个回,认为这个回来估计的结果越逼真。具体到上例,来估计的结果越逼真。具体到上例,。n n有时模型中还会有可调整的判定系数。记作,有时模型中还会有可调整的判定系数。记作,n n 通常,可调整判定系数会小于判定系数。通常,可调整判定系数会小于判定系数。n n 计算实例计算实例计算实例计算实例实例对比实例对比n n3.53.5其他简洁线性回来模型其他简洁线性回来模型n n有
42、时从数据的图形来看,因变量与自变量之间并有时从数据的图形来看,因变量与自变量之间并不呈直线关系,而是有明显的曲线关系。那么,不呈直线关系,而是有明显的曲线关系。那么,可以通过对变量的转换来使其变成直线关系。通可以通过对变量的转换来使其变成直线关系。通常可以接受自然对数、平方、立方、平方根,甚常可以接受自然对数、平方、立方、平方根,甚至更困难的指数形式来转换变量。下面列举几个至更困难的指数形式来转换变量。下面列举几个方程式:方程式:n n n n3.53.5其他简洁线性回来模型其他简洁线性回来模型实例实例n n 下面是某一经济现象的一组数据资料:下面是某一经济现象的一组数据资料:n n 假如干脆
43、对这组数据做简洁的回来分析,则可以得到假如干脆对这组数据做简洁的回来分析,则可以得到如下的结果。如下的结果。n n从模型的参数估计值以及从模型的参数估计值以及t t统计量检验和统计量检验和F F统计量检验统计量检验来看,均没有什么大的问题,但是其拟合优度远远低来看,均没有什么大的问题,但是其拟合优度远远低于模型的要求,即于模型的要求,即R R不小于不小于0.640.64。这说明模型有问题,。这说明模型有问题,可能是模型假设有问题,下面不妨假设其方程形式是可能是模型假设有问题,下面不妨假设其方程形式是 。这样变更后,再做归回分析可以得到这样的结果。这样变更后,再做归回分析可以得到这样的结果。n
44、n3.53.5其他简洁线性回来模型其他简洁线性回来模型实例实例n n从模型的参数估计值以及从模型的参数估计值以及t t统计量检验和统计量检验和F F统计量统计量检验来看,均没有什么大的问题,但是其拟合优检验来看,均没有什么大的问题,但是其拟合优度远远低于模型的要求,即度远远低于模型的要求,即R R不小于不小于0.640.64。这说明。这说明模型有问题,可能是模型假设有问题,下面不妨模型有问题,可能是模型假设有问题,下面不妨假设其方程形式是假设其方程形式是 。这样。这样变更后,再做归回分析可以得到这样的结果。结变更后,再做归回分析可以得到这样的结果。结果见下。果见下。n n3.5其他简洁线性回来
45、模型实例第四章第四章 回来分析的最大似然法回来分析的最大似然法n n回来分析一般由两种方法:最小二乘法和最大似回来分析一般由两种方法:最小二乘法和最大似然法。然法。n n最小二乘法只要求因变量的随机性,通过探讨自最小二乘法只要求因变量的随机性,通过探讨自变量对因变量的影响来估计出离因变量均值的最变量对因变量的影响来估计出离因变量均值的最小误差的线性参数方程;最大似然法是在已知因小误差的线性参数方程;最大似然法是在已知因变量的概率分布的状况下,通过其概率函数,最变量的概率分布的状况下,通过其概率函数,最大限度地利用给定的样本的信息来估计总体的状大限度地利用给定的样本的信息来估计总体的状况,从而使
46、估计出的参数方程能最大可能地反应况,从而使估计出的参数方程能最大可能地反应总体的状况,同时也是偏差最小的参数方程。总体的状况,同时也是偏差最小的参数方程。n n4.14.1概率函数和概率分布概率函数和概率分布n n要弄清最大似然法,首先得将概率函数和概率要弄清最大似然法,首先得将概率函数和概率分布弄清晰。假设某一随机变量为分布弄清晰。假设某一随机变量为Y Y,听从某,听从某一特定的分布一特定的分布F F。那么,会有该随机变量的概。那么,会有该随机变量的概率函数和概率分布。率函数和概率分布。n n随机变量分别散型变量和连续性变量。对于离随机变量分别散型变量和连续性变量。对于离散型变量,其概率函数
47、定义为:散型变量,其概率函数定义为:n n其分布函数定义为:其分布函数定义为:n n4.14.1概率函数和概率分布概率函数和概率分布n n假如变量是连续型变量,那么概率函数被定义为:假如变量是连续型变量,那么概率函数被定义为:n n1.1.对全部的对全部的Y Y值来说值来说n n2.2.n n3.3.对于任何对于任何a a和和b b来说,假如来说,假如 ,那么,那么n n n n定义分布函数为:定义分布函数为:n n同时有:同时有:n n4.24.2最大似然函数最大似然函数n n首先给定一个线性模型首先给定一个线性模型 ,明显是希望能够合,明显是希望能够合理地估计出最好的参数值。若已知随机变量
48、理地估计出最好的参数值。若已知随机变量Y Y听从听从某一特定的分布某一特定的分布F F(Y)Y),可以得知该变量的概率函,可以得知该变量的概率函数是数是 ,这是一个条件概率,即随机,这是一个条件概率,即随机变量的变量的Y Y在某一特定的位置的概率是受到自变量在某一特定的位置的概率是受到自变量X X及参数影响的。于是我们的目的是试图估计出一个及参数影响的。于是我们的目的是试图估计出一个这样的参数值,它使给定样本数据所估计出来参数这样的参数值,它使给定样本数据所估计出来参数方程最大可能地反应总体的状况。其似然性是由其方程最大可能地反应总体的状况。其似然性是由其概率函数值的连乘积组成的。这个概率函数
49、值的连概率函数值的连乘积组成的。这个概率函数值的连乘积叫做似然函数,定义为乘积叫做似然函数,定义为 ,对上,对上述似然函数取对数,定义为对数似然函数为:述似然函数取对数,定义为对数似然函数为:n n n n4.24.2最大似然函数最大似然函数n n要求出上述似然函数的极大值,也是最大值,即要求出上述似然函数的极大值,也是最大值,即只要设其一阶导数等于零,在验证二阶导数小于只要设其一阶导数等于零,在验证二阶导数小于零即可。下面求出其一阶导数并令其等于零。零即可。下面求出其一阶导数并令其等于零。n n 从上述等式中可以解出参数值。从上述等式中可以解出参数值。n n求出其二阶导数并验证,有:求出其二
50、阶导数并验证,有:n n依据上述等式求出的参数结果是比较志向的估计依据上述等式求出的参数结果是比较志向的估计结果,但是确定要有大量的样本才会是比较志向结果,但是确定要有大量的样本才会是比较志向的估计结果。这个结果与用最小二乘法估计的结的估计结果。这个结果与用最小二乘法估计的结果是特别接近的,甚至完全一样。果是特别接近的,甚至完全一样。n n4.34.3特定函数的分布模型和最大似然估计特定函数的分布模型和最大似然估计n n 用最大似然估计法估计数学模型,首先要知道用最大似然估计法估计数学模型,首先要知道数据副那种分布,现在我们以正态分布为例,同数据副那种分布,现在我们以正态分布为例,同时选取最简