《计量经济学知识点经济经济学_经济-经济学.pdf》由会员分享,可在线阅读,更多相关《计量经济学知识点经济经济学_经济-经济学.pdf(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 1.计量经济学含义:以经济理论为基础,以统计资料为材料,运用数理统计知识和计算机技术,建立计量模型,对经济变量进行定量分析,以验证经济理论、分析政策效果、或进行商业预测。2.计量经济学和其他学科关系 1、经济学,尤其是数理经济学,为其提供理论依据 2、经济统计学为其提供搜集加工整理统计资料的工具 但价格、收入、投资、储蓄等经济数据是不可控的非实验数据,存在测量误差、遗漏、设计错误等 3、数理统计为其提供假设检验的工具,以验证模型正确性 主要有概率、概率分布、随机变量、抽样、参数估计、假设检验和回归分析等内容,只有具备了一定的数理统计学基础,才能很好地掌握计量经济学。4、线性代数 3.经
2、济计量学建模步骤 p2 一、寻找研究的理论依据/设立一个理论假说 二、确定统计指标,搜集编制数据 明确变量对应的统计指标 数据分类:时间序列数据:按时间跨度收集到的数据集合 横截面数据:某个时点上的数据集合 合并数据:时间序列数据和横截面数据的组合 数据来源:统计年鉴、统计类网站、数据公司 三、建立数学模型 四、设立经济计量模型:引入误差项 自变量和因变量之间是统计关系,而不是确定的函数关系 解释变量:函数的自变量 被解释变量:函数的应变量 五、采用适当方法,估计模型参数 六、进行检验,验证模型的适用性 经济检验:所估计参数的符号,大小是否符合理论等 统计性检验:拟合优度检验:回归线拟合真实值
3、优劣程度 参数显著性检验:样本是否很好的代表了总体 计量经济检验:回归模型前提条件的检验,例如多重共线性检验,异方差检验。预测性检验 本章考核要求 识记:计量经济学含义、统计数据分类、参数、斜率、截距、解释变量和被解释变量、随机误差项等基本概念。领会:计量经济学与其他学科的关系,计量经济模型基本的建模步骤 第二章 1.求和符号的性质 p17 常数的 n 次求和为常数的 n 倍 常数可提到求和符号前 两个变量的求和等于对两个变量分别求和 2.几个定义 1、实验:例:测试某批共 1000 灯泡的使用寿命 2、总体:实验的所有可能结果的集合 例:该批灯泡中每个灯泡的使用寿命,以小时计 3、样本:由总
4、体中抽出的若干个体的集合。从该批灯泡中抽取 100 个灯泡,测试使用寿命 抽取的原则:随机抽取。3.样本、总体和随机变量 所谓样本就是 N 个相互独立且与总体同分布的随机变量 数理统计的一个主要工作就是由样本去推断总体的数字特征。总结:总体可以表示为一个随机变量,样本就是 N 个与总体同分布的随机变量,总体分布 就是样本和总体的联结点。4.区间概率的计算 5.数学期望有如下性质 6.方差的性质 常数的方差为零,var(k)=0 随机变量加上一个常数不改变变量的方差 var(X+k)=var(X)随机变量常数倍的方差等于变量方差的常数平方倍 var(aX)=a2var(X)(随机变量线性变换的方
5、差=?)如果两个随机变量相互独立,和之方差等于方差之和 var(X+Y)=var(X)+var(Y)返回 7.协方差 8.相关系数、样本相关系数 9.注意(样本均值)我们希望知道总体的一些数字特征,特别是均值,方差等。这只有在获得所有可能的结果时,才能得到。例:灯泡的平均寿命 1kE(k)k,;2XY,E(XY)E(X)E(Y)3X,E(aXb)aE(x)b4X、为常数,常数的均值为其本身、对于随机变量、随机变量和的均值等于均值的和、对于随机变量随机变量线性变换的均值为均值的线性变换、当随机变量、Y相互独立时,E(XY)=E(X)E(Y)性质同上)()(的概率密度函数为如果随机变量学期望:)连
6、续型随机变量的数dxxf x)X(ExfX2之间是如何变动的。协方差度量了两个变量其协方差例,对于两个随机变量协)Y)(-E(X=Y)Cov(X,Y)Cov(X,YX,方差:、3YXxYcov(X,Y),11 1r1,SS)Y,X(covrYx变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理
7、论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估通常只能得到关于总体的一个样本,我们的目标在于,通过获得的样本数据,对总体的数字特征进行估计,因此需要确定一个法则,将样本中我们关心的信息集中起来,这样的法则称为统计量,也称为估计量 样本均值就是一个估计量,拿到样本后,依据样本均值的计算法则得到的具体数字称为估计值 同时样本均值也是一个随机变量,样本均值的估计值依每次抽样不同而按概率取不同的值。该
8、随机变量有它自己的均值和方差 10.样本均值的均值和样本均值的方差 11.注意(样本方差)样本方差同样是个估计量,由具体某个样本计算得到的样本方差的数值为估计值 样本方差同样是个随机变量,有它自身的均值和方差 关于 1/(n-1):可以用自由度的概念来解释 可以证明:样本方差的均值=总体方差的均值 即样本方差是总体方差的无偏估计。样本方差存在量纲问题 样本标准差 sx:为样本方差的平方根 12.正太分布性质 围绕均值 u 中心对称,曲线下总面积为 1,钟形分布 P(xu)=0.5 根据均值和方差,可求得随机变量落入任何区间的概率 阴影部分面积即为 0.95,而1.96 倍标准差的概率为 0.0
9、25 正态分布变量的线性变换仍然服从正态分布。两个正态分布变量的线性组合仍然服从正态分布。13.中心极限理论 注意:对随机变量x 本身具体服从什么分布不做要求,只要相互独立,其和渐近于正态分布,主要是大量变量相加后,许多随机因素相互抵消的缘故。14.卡方的性质 1)卡方分布只取正值 2)卡方分布是斜分布,随着自由度的增大,逐渐对称并接近正态分布。3)两个服从卡方分布的独立随机变量,其和也服从卡方分布 15.关于卡方分布的两个定理 nXvarXn var n1Xvarn1)x(varXXvarn1Xn1var)X(var)X(E)X(nEn1)X(En1)Xn1(E)X(E)X(var)X(Ex
10、ii2i2ii2iiiii)()()(之间相互独立)()(的无偏估计)(样本均值是总体均值,方差,其均值随机变量,n为,均值xn,为,均值具有同分布,X如果独立随机变xxi的正态分布标准差于的抽样分布越来越接近的增大,样本均值则随着样本容量对其抽样,标准差其量NXX对其标准化:12.(0,1)niXXXN22ii1)有个随机变量,相互独立,则X和(X-X)相互独立,且(X-X)(n-1)222x2x22xxn1SX N(n-1),Sn()2)(,),则有其中为样本方差,为总体方差,为样本容量变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为
11、其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估16.t分布 表示:性质:1)t 分布和标准正态分布非常类似,对称分布。2)t 分布均值为 0,方
12、差为 k/(k-2),k 为自由度 当样本容量增大时,t 分布方差快速趋向 1 运用:总体方差已知时,用正态分布进行假设检验和统计推断,但当总体方差未知时,用 t 分布进行假设检验和统计推断 17.分布 表示:性质:1)非负,斜分布 2)自由度增大时,趋近与正态分布 本章考核要求 领会估计量、估计值、总体各数字特征、样本各个数字特征 掌握各分布的随机变量的概率的计算 第三章 1.关于区间估计 1)所得区间为随机区间,因为样本均值为随机变量 2)这样的区间解读为:以这种方式构造出来的随机区间包含待估参数真值的概率为置信度,例:设置信度 95%,抽样 100 次,得到 100 个这样的区间,其中有
13、 95 个区间一定包含 u 这个数值。3)如果我们预先猜测一个 u 的真值,而抽样得到一个样本均值,如果依据这个样本均值构造的区间没有包含我们预先猜测的值,发生这种情况的概率显著性水平 4)一个样本均值有一个固定的区间,不可说这个区间包含待估参数真值的概率为 95%。5)关于精度,即区间宽度,在同样置信度下,我们希望区间越窄越好。即:总体方差越小越好 样本容量越大越好 6)同一个总体,置信度越高,则区间越宽 2.对总体均值的估计 分为总体方差是否已知两种情形 方差已知,估计 u 的置信区间 总体分布未知:利用切贝谢夫不等式 若为大样本:依据中心极限定理 若为正态总体、小样本 方差未知,估计 u
14、 的置信区间 若为大样本:依据中心极限定理和大数定律,总体方差可用样本方差代替 若为小样本但来自正态总体:利用 t 分布 3.对总体方差的估计 小样本下,正态分布总体,方差的置信区间的估计:利用卡方分布 4.点估计量应具备的性质 评价点估计量是否优良的的标准:1、线性 若估计量 是样本观测值的线性函数,则称该估计量为线性估计量 意义:线性估计量处理起来相对简单 分布。的服从自由度为即,则定义)(),随机变量,(设随机变量tnt),n(ttnYXtnY10NX2)nn(FF,nYnXF,nY,nX21211212则则定义且相互独立,)()(如果随机变量96.1nxx),(nNXx),(nSNXx
15、变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当
16、方法估 样本均值就是一个线性估计量 2、无偏性 估计量的均值=其对应的待估参数的真值(作图)。意义:随机变量围绕其均值,即数学期望波动,估计量具备无偏性可使其尽量靠近对应的待估参数的真值 样本均值就是一个无偏估计量 3、有效性 同一个参数的所有无偏估计量中,方差最小的那个估计量称为有效估计量 方差衡量了数据的离散程度,估计量具备有效性,即方差最小,可使其尽量靠近对应的待估参数的真值 4、小结:最佳线性无偏估计量 最佳线性无偏估计量():在所有线性无偏估计量中,方差最小的估计量 评价点估计量是否优良的的标准 5、一致性 5.假设检验 判断标准:小概率事件原理:如果一事件发生的概率很小,则我们称该
17、事件在一次试验中为不可能事件 方法:1、置信区间法 步骤:给定一个置信度 作区间估计,给出相应的置信区间 给出零假设(即设定待估参数的值)如果零假设落在置信区间之外,则拒绝零假设;反之接受零假设/无法拒绝零假设 零假设所设定的待估参数的值落在置信区间之外,这是一个小概率事件,在一次试验中为不可能事件,我们与其信零假设为真,不如信其为假(但拒绝零假设,不意味着零假设一定为假)两类错误:我们做出判断的依据是一组样本数据,因而假设结果不可能绝对正确,原因来自抽样误差 弃真错误/第一类错误:零假设为真,但检验结果把他拒绝了,这类错误的概率为 取伪错误/第二类错误:零假设为假,但检验结果把他接受了 2、
18、显著性检验法 通过构造一个统计量,比较该统计量和临界值的大小来判断零假设是否成立 步骤:提出零假设和备则假设 (备则假设分单边和双边,此处只考虑双边情形)根据样本信息,构造统计量 Z 此时要确定该统计量服从何种分布,即到底要用哪一个分布来做假设检验 确定显著性水平,查对应的概率表得到临界值(此处为双边假设的临界值)比较|z|和临界值的大小。返回 如果是双边假设,当|z|待估参数个数 假定 7:解释变量 X 值有变异性 即 X 有一个相对较大的取值范围 如果 X 只在一个狭窄的范围内变动,则无法充分估计 X 对被解释变量 Y 的系统影响。例:如果收入差异不大,我们无法观察支出 Y 的变动 假定
19、8:如果有多个解释变量,要求解释变量间没有很强的线性关系 无多重共线性 iiiiii01iiiiiiYYeYYYbb Xe,eYY被解释变量的样本值和之间存在差异,定义样本回归方程的随机形式:我们把称为样本残差项,它其实是总体回归方程中随机误差项 的估计量。变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论
20、依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估假定的意义:如果满足这些假定,则高斯-马尔可夫定理成立:在所有线性无偏估计量中,普通最小二乘(OLS)估计量有最小方差。这使得 OLS 估计量有着优良的性质可以进行统计推断 完全满足这些假定的方程在现实中是不存在的,但这些假定为我们提供了一个比较的基准,本课其他部分主要是围绕假定不被满足时,分析后果,提出解决办法 2.ols估计量的概
21、率分布 p129 假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布 如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是 Y 的线性函数,因此其概率分布取决于 Y,而 Y 的概率分布取决于随机误差项 3.稻草人假设 回归分析是要判断解释变量 X 是否是被解释变量 Y 的一个显著性的影响因素。在一元线性模型中,就是要判断 X 是否对 Y 具有显著的线性性影响。这就需要进行变量的显著性检验 计量经计学中,主要是针对变量的参数真值是否为“零”来进行显著性检验的。即 这样的零假设也称为“稻草人假设”,如果稻草人假设成立,说明解释变量 X 不是
22、被解释变量 Y 的一个显著性的影响因素 4.拟合优度检验 P134 对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2 几个概念:对于所有样本点,则需考虑这些点与样本均值离差的平方和 拟合优度:回归平方和 ESS/Y的总离差 TSS 5.一些结论:对于 Y 的总体均值 E(Y|X)与个体值的预测区间(置信区间)(1)样本容量 n 越大,预测精度越高(2)样本容量一定时,置信带的宽度当在 X 均值处最小,其附近进行预测(插值预测)精度越大;X 越远离其均值,置信带越宽,预测可信度下降。(3)样本方差越小,预测精度越高 本章逻辑 我们需要进行:参数显著性检验
23、 拟合优度检验 回归总体线性检验 而高斯-马尔科夫定理给出了进行统计检验的信息 而高斯-马尔科夫定理的成立需要一些假定条件=猫嘎的分割线=第六章 多元线性回归模型 多元回归模型 1201212111211101221222220121201212,1,2,iiikiikiiikikkkknnnknnkkikiniiuYXXXXY X XuYXXXuYXXXuYXXXX XX LLLLL L LLL数据:、等为具体某个解释变量,中的 表示为第 次观测为偏回归系数变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供
24、搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估 第一节多元线性回归的模型的表示和基本假定 一、一般线性回归模型的基本表示方法 函数形式 矩阵形式 二、偏回归系数 三、古典(经典
25、)假定 假定 1:随机扰动项的零均值假定 假定 2:随机扰动项的零均值假定的同方差假定 假定 3:无自相关假定(多元线性回归模型)niEi,2,10)(或 000)(2121nnEuEuEuuuuEUEUXYniuXXXYiKiKiii,2133221nYYY21112111222212111kknnknXXXXXXXXXLLLLLLLLk21nuuu211112112122221201122111kknnnknnkYXYXXXYXXXYXXXuuu LLMMMMMLMMYX Kk为偏回归系数,或偏斜率系数,度量了当其他变量不变时,对应的变量X的单位变动引起的Y的条件均值的改变量。由此,多元线
26、性回归模型能够“分离”出每个解释变量对被解释变量的影响。(p154例)niuEuEuEuVariiii,2,1)()()(222变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型
27、四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估 假定 4、随机扰动项与解释变量不相关(相互独立)假定 5、正态性:随机扰动项服从正态分布 线性回归模型:例:一元线性回归模型:6、无多重共线性,即假定各解释变量之间不存在线性关系(注:多元线性回归模型才有无多重共线性的假定)第二节多元线性回归的参数的 OLS 估计及其性质 一、参数的 OLS 估计 基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。例如:多元线性回归模型的“残差平方和”为:kiuEuEuuEEuuEuuEuuCOVkikikki
28、iki0)()()()(),()(,),(),()()()(3222112211nnnnuEuuEuuEuuEuuEuuEuEUUEEUUEUUEUVaru)()()(协方差矩阵的方差即随机干扰项、假定假定阶单位阵为其中nIn:nnnnnnnIuuEuuEuuEuuEuuEuuEuuEuuEuuE2222212221212111000000)()()()()()()()()(0),(jiYYCov00)()(即,uXEuXCoviji00022ikiiiiikiiiiEuXEuXEuuXuXuE或),0(2Nui),(221iiXNYkXRankX)(满秩的假定解释变量观测值矩阵kXXRank
29、XX)(也应是满秩的:此时,方阵存在),(所以行列式10XXXX 该式成立,X至少有K阶子行列式不为零,表明解释变量之间不存在线性相关关系。),0(2Nui2221122)()(kikiiniiiiXXYYYeQ变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明
30、确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估要使“残差平方和”达到最小,其充分条件是 即:二、参数估计量的性质 在满足基本假设的情况下,总体参数 的普通最小二乘估计具有:线性性、无偏性、有效性。即高斯-马尔可夫定理一样成立 0)(20)(20)(2221222122211kikikiikikikiikikiiXXXYQXXXYQXXYQ 化简得正规方程组 1111212112111000ini ikkknnKi ieeXX
31、XeX eXeXXXeX e LLMMLMMMMLeXY样本回归函数为YXXXk)(121的积的列向量行与的第)是()(因为njkYYYYjXXXXYXX211121的线性组合是ijYkj),2,1(的线性函数。为所以ijY1、线性性:kjeQjij,20)(2变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的
32、理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估 4、小结:估计量的统计性质 kkEEE11)(YXXX 1)(因为XXXXXXXXXXXXXX1111)()()()()()(XXXEE 1)()()()()()(01EEXXXE2、无偏性 3、最小方差性:参数向量的最小二乘估计是 的所有线性无偏估计中方差最小的估计量。:jOLS估计量的方差为2112,)jjjjjVarcjn
33、cXXjL()(,(是矩阵()的第 个主对角元素)可以证明:此方差在所有线性无偏估计量中方差最小1(1,2,)jijkYL)线性性:参数的估计量是 的线性组合2()(1,2,)jjEjnL)无偏性:3)最小方差性::j的方差为2112,)jjjjjVarcjncXXjL()(,(是矩阵()的第个主对角元素)在所有线性无偏估计量中方差最小:(1,2,)jjkL4)的方差、标准差的估计量分别为:222()-1jijjjjeSccnk2jjjjSSc222():(-1)ienk其中 多元的无偏估计量为,K为解释变量个数变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经
34、济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估三、ols估计量的概率分布 假设检验需要指明总体参数(即总体回归系数)的估计
35、量(即样本回归系数)服从何种分布。如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是 Y 的线性函数,因此其概率分布取决于Y,而 Y 的概率分布取决于随机误差项。有了样本回归系数的 OLS 估计量的分布信息,就可以利用它进行总体回归系数的统计推断。1、正态性假定:随机误差项服从正态分布,随机扰动项代表了未引入模型的随机影响之和,依据中心极限定理,大量独立同分布的随机变量之和趋向于正态分布 第三节多元线性回归的统计检验 一、拟合优度检验 p158 1、多元判定系数 R2 多元判定系数和一元判定系数的计算方法是一样的:因为判定系数的计算只和被解释变量 Y 有关,和解释
36、变量 X无关。2、调整后的多元判定系数(p165)多元判定系数 R2 存在一个问题:当解释变量个数增多时候,离差平方和 RSS 至少不会增大,则多元判定系数R2 一般会随着增大解释变量个数增多而增大。1)可决系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的;2)导致解释变量个数不同模型之间对比困难;可决系数只涉及变差,没有考虑自由度。因此在比较同一被解释变量,但又不同个数的解释变量的模型的时候,R2 存在不合理的地方 调整后的多元判定系数性质 二、对回归参数进行假设检验:显著性检验法(
37、p135)多元线性回归的参数的显著性检验 1、同为稻草人假设 2、自由度为 n-k-1,k为解释变量个数 3、得到 t 值后和临界值比较,当 t 值大于临界值,则拒绝零假设 三、对联合假设的检验(p161)),0(2Ni2122(,()jjjjjjjjNVarVarccXXj、则其中:()(是矩阵()的第 个主对角元素)当未知时,和一元线性回归相同,可以用 t 检验来进行统计检验2i222i222222en1nk1R11(1R)ynk-1n11k1,RRRR2R3R 、当则,随着模型中解释变量的增加,越来越小于、可能为负、可以帮助我们对相同被解释变量,不同解释变量的回归模型进行比较iitS变量
38、进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法
39、估 拟合优度检验和 F 检验的对比:1)拟合优度检验和 F 检验都是对回归方程显著性的检验,都是把总离差 TSS 分解成回归平方和 ESS 与残差平方和 RSS,并在此基础上构造统计量进行检验。F 检验零假设成立等价于判定系数为零 2)模型对观测值的拟合程度越高,模型总体线性关系的显著性就越高。3)区别:F 检验有精确的分布。第七章 回归方程的函数形式 本章示范如何将一些非线性模型转换为线性模型,有何特殊用途。第一节对数-对数模型用于测量弹性(p181)一、对数-对数模型含义 方程两边变量以对数形式出现(注意参数依然是线性的)二、对数-对数模型用于测量弹性 1、回顾弹性的含义 需求的价格弹性含
40、义:商品价格每变动 1%,带来需求量变动的百分比,即两个相对变动的比值 变差来源 平方和 自由度 方差 回归 残差 总变差 回归方程的显著性检验F检验(检验因变量和诸自变量之间是否存在显著的线性关系)1、检验的假设:0320kH:不全为零:),3,2(1kjHj0()2(,1)(1)ESSkHFF k nkRSSnk 、成立,则3、根据样本数据,计算F统计量的值 4(,1)FFk nk、对于给定显著性水平,查 分布表确定临界值,说明回归方程显著拒绝原假设、0,),1(5HknkFFESSkESSkRSS-1nk(1)RSSnk(1)ESS kFRSS nk 1nTSS*YAL KLNYLNAL
41、NLLNK-YLNY,ALNA,LLNL,KLNKYALK 对于两边取自然对数,我们可以转换为,此类模型称为对数 对数模型,在回归分析中有特殊作用令如果新的方程满足经典假定,则可使用OLS 法估计PdPQdQPdPQdQ变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编
42、制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估2、对对数-对数模型进行全微分 我们可以看到此时弹性(,)在模型中作为回归参数,是不变的,所以我们也称双对数模型为固定弹性模型或者不变弹性模型。三、对数-对数模型的假设检验 1、视为和普通线性回归相同 2、(了解)但是正态性假定发生了变化 四、线性模型和双对数模型的比较 1、不能单纯根据判定系数或者调整后的判定系数的大小来选择模型 注意:只有被解释变量相同的模型,判定系数
43、或调整后的判定系数的比较才有意义。2、一元回归可通过观察散点图来选择模型 3、应从实际出发选择模型,例如经济理论表明变量间的关系确实是不变弹性的,则选择对数-对数线性模型。五、例题:P186,例 9-2,C-D生产函数 被解释变量:实际 GDP 解释变量:资本:资本存量 劳动投入:就业人数 LNY=-1.6524+0.34LNL+0.86LNK T (-2.73)(1.83)(9.06)R2=0.995 解释:系数含义:0.34 表示为劳动的产出弹性,劳动投入每增加 1%,带来产出增加 0.34%(纠正书本错误),0.86 表示资本的产出弹性,意义类似 资本的产出弹性远大于劳动的产出弹性,为资
44、本投入驱动的经济体系 规模经济特征:0.34+0.85=1.18,1.181,为规模报酬递增经济 R2=0.995,回归拟合程度很高(未报告调整后的 R2)返回 第二节半对数模型测度增长率(P188)一、半对数模型含义 方程的某一边采用对数形式,另一边为线性形式 含义相同。变动时,每变动衡量的是弹性,当,即时不变,即当由偏回归系数含义得:对上式全微分得:%Y%1LLdLYdY0dkkKdKLdLYdYLNKLNLLNALNY长率半对数模型用于测度增后者为线性到对数模型型,前者为为对数到线性模式。一边的变量采用对数形方程两边只有型此类模型称为半对数模,LNXbbYXbbLNY110110变量进行
45、定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估二
46、、半对数模型测度增长率 第三节其他模型 一、双曲线/倒数模型 1、定义:2、双曲线函数应用 1)当两个参数都大于零时,函数曲线如右图,生产的平均固定成本函数具有此形状。Y:平均固定成本 X:产量 2)当 B1 0,B2 0 时,函数曲线如右图,恩格尔消费函数具有此形状。Y:在某一商品上的消费支出 X:消费者收入 3)当 B1 0 时,函数曲线如右图,菲利普斯函数具有此形状。Y:工资增长率(后来演化为通胀率)X:失业率 3、例题 P194,9-6,菲利普斯曲线 二、多项式回归模型 1、定义 Y=B1+B2X+B3 X2+B4X3+的绝对量的变动带来即相对量变动一个单位,含义:将其全微分可得:、对
47、于线性到对数模型的变动,的相对量(即增长率)带来绝对量变动一个单位,含义:将其全微分,可得:、对于对数到线性模型Y%,1XbXdXdYb,XdXbdYLNXbbY2YXbdXYdYb,dXbYdYXbbLNY111111111110111111110值无限增大时,曲线有极一个典型特征:当被称为双曲线函数模型的函数形如X,)X1(BBY21变量进行定量分析以验证经济理论分析政策效果或进行商业预测计量经济学和其他学科关系经济学尤其是数理经济学为其提供理论依据经济统计学为其提供搜集加工整理统计资料的工具但价格收入投资储蓄等经济数据是不可控的非随机变量抽样参数估计假设检验和回归分析等内容只有具备了一定
48、的数理统计学基础才能很好地掌握计量经济学线性代数经济计量学建模步骤一寻找研究的理论依据设立一个理论假二确定统计指标搜集编制数据明确变量对应的统计据和横截面数据的组合数据来源统计年鉴统计类网站数据公司三建立数学模型四设立经济计量模型引入误差项自变量和因变量之间是统计关系而不是确定的函数关系解释变量函数的自变量被解释变量函数的应变量五采用适当方法估多项式回归模型的变量间不存在多重共线性,视同多元线性回归返回 2、例题 p198 例题 9-9 三、其他 关于过原点回归 p199-只有在充分理论保证之下才能使用过原点的回归 关于度量单位的说明:p200-所有回归的判定系数相同-度量单位的变动会带来截距
49、或斜率的不同 Y 单位不变,如果把 X 的单位扩大 10 倍,导致 X 的数值缩小 10 倍,为了维持 Y 不变,斜率需要扩大 10 倍。第八章 包含虚拟变量的回归 第一节虚拟变量含义 P212 一、虚拟变量(dummy variable)对某个定性因素人为赋值,成为能进入模型的变量。例:解释薪酬差异,设以教育年限 X1、工作经验(工作年数)X2,“性别”三个变量来解释:对于性别,设置虚拟虚拟变量 D:=0,男性 =1,女性 Y=b0+b1X1+b2X2 b3D 当 b3能够通过 t 检验时,说明性别对薪酬有影响,即存在性别歧视 二、方差分析模型(ANOVA)(方差分析模型在其他社会科学中使用
50、较多):特别的,当回归中解释变量都是虚拟变量时,此类模型称为方差分析模型。P212 Y=b0+b1D1+b2D2 三、协方差模型(ANCOVA)解释变量有定性变量也有定量变量.(P217)Y=b0+b1 X1+b 2X2b3 D 四、小结 1)虚拟变量是一用以反映质的属性的一个人工变量,通常记为 D。2)虚拟变量 D 只取 0 或 1 两个值 3)设 D=0,即取值为 0 的那一类称为基准类/基础类/参照类/比较类 4)虚拟变量引入模型,可以直接使用 OLS,不会带来新的估计问题。第二节虚拟变量设定 一、虚拟变量设置原则 1、模型中只有一个两分定性变量 p217 例如性别定性变量,只有两种分类