《第3章 双变量模型假设检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第3章 双变量模型假设检验精选PPT.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第3章章 双变量模型假设检双变量模型假设检验验第1页,本讲稿共44页对于样本回归函数对于样本回归函数第2页,本讲稿共44页3.1 3.1 经典线性回归模型的基本假定经典线性回归模型的基本假定假定假定3.1 3.1 回归模型是参数线性的回归模型是参数线性的,但不一定是但不一定是变量线性的。变量线性的。第3页,本讲稿共44页假定3.2 解释变量与随机误差项不相关。但是,如果X是非随机的,则该假定自动满足。条件回归分析,假定条件回归分析,假定X X的取值在重复抽样中是固的取值在重复抽样中是固定的。定的。这一假定的目的是?这一假定的目的是?斜率系数的含义是它衡量了在其它因素不变的情斜率系数的含义是它
2、衡量了在其它因素不变的情况下,解释变量况下,解释变量X X的变动对的变动对Y Y的变动的影响。的变动的影响。如果解释变量如果解释变量X X与随机误差项相关,就无法区分它与随机误差项相关,就无法区分它们各自对应变量们各自对应变量Y Y的影响。的影响。第4页,本讲稿共44页假定假定3.3 3.3 随机误差项的期望值为随机误差项的期望值为0 0,即,即YXX1X2X3第5页,本讲稿共44页对于确定性的总体回归函数实际上就隐含了这一假定实际上就隐含了这一假定第6页,本讲稿共44页假定假定3.4 3.4 同方差假定同方差假定YXX1X2X3第7页,本讲稿共44页假定同方差的目的是从不同的子总体中抽取的Y
3、值都是同样可靠的。因为它们各自的方差是相等的,其分散程度相同。相反,如果存在异方差,不同的子总体的方差相反,如果存在异方差,不同的子总体的方差不同,那么一般说来,从方差较大的子总体中不同,那么一般说来,从方差较大的子总体中抽取的抽取的Y Y值代表性较值代表性较_。第8页,本讲稿共44页 异方差异方差YXX1X2X3第9页,本讲稿共44页假定假定3.5 3.5 无自相关假定,无自相关假定,第10页,本讲稿共44页3.2 OLS3.2 OLS估计量的方差与标准误估计量的方差与标准误OLSOLS估计量是随机变量估计量是随机变量,这样,就会产生抽样误差,这样,就会产生抽样误差,即不同样本的估计值的差异
4、。即不同样本的估计值的差异。称为残差平方和称为残差平方和称为自由度称为自由度称为回归标准误称为回归标准误n-2n-2第11页,本讲稿共44页对于残差平方和自由度的理解对于残差平方和自由度的理解要计算残差平方和要计算残差平方和需要先计算出需要先计算出而要计算而要计算需先计算出需先计算出的计算是根据以下两个方程得到的,的计算是根据以下两个方程得到的,这实际上相当于对这实际上相当于对Y Y值施加了两个约束条件,值施加了两个约束条件,从而其独立的观测值只有从而其独立的观测值只有n-2n-2个。故残差平方个。故残差平方和的自由度只有和的自由度只有n-2n-2第12页,本讲稿共44页3.3 OLS3.3
5、OLS估计量的估计量的统计统计性质性质 高斯高斯马尔柯夫定理:如果满足经典线马尔柯夫定理:如果满足经典线性回归模型的基本假定,性回归模型的基本假定,OLSOLS估计量是最估计量是最优线性无偏估计量。优线性无偏估计量。何为最优线性无偏估计量?何为最优线性无偏估计量?何为最优线性无偏估计量?何为最优线性无偏估计量?第13页,本讲稿共44页线性线性是随机变量Y的线性函数。第14页,本讲稿共44页无偏性:无偏性:第15页,本讲稿共44页最小方差性最小方差性在所有的线性无偏估计量中,在所有的线性无偏估计量中,的方差最小的方差最小其它线性无偏估其它线性无偏估计量计量OLSOLS估计量估计量第16页,本讲稿
6、共44页3.4 OLS3.4 OLS估计量的抽样分布估计量的抽样分布 假定假定3.73.7:随机误差项服从正态分布:随机误差项服从正态分布 中心极限定理:独立同分布的随机变量,随着变量个数中心极限定理:独立同分布的随机变量,随着变量个数的无限增加,其和的分布趋向于服从正态分布。的无限增加,其和的分布趋向于服从正态分布。为什么要做这样一个假定,目的何在?为什么要做这样一个假定,目的何在?第17页,本讲稿共44页应变量应变量Y Y也服从正态分布也服从正态分布正态分布随机变量的线性函正态分布随机变量的线性函数也服从正态分布数也服从正态分布OLSOLS估计量是线性估计量,是应变量估计量是线性估计量,是
7、应变量Y Y的线性函数的线性函数正态分布随机变量的线性函正态分布随机变量的线性函数也服从正态分布数也服从正态分布OLSOLS估计量也服从正态分布估计量也服从正态分布根据中心极限定理根据中心极限定理随机误差项服从正态随机误差项服从正态分布分布应变量应变量Y Y是随机误差项的是随机误差项的线性函数线性函数根据根据第18页,本讲稿共44页为什么要推导为什么要推导OLSOLS估计量的抽样分布?估计量的抽样分布?第19页,本讲稿共44页3.5 3.5 假设检验假设检验 经济意义是由经济理论决定的,主要是参参数的符号和大小是否符合经济理论对这些数的符号和大小是否符合经济理论对这些参数的符号和大小的约束参数
8、的符号和大小的约束。如果不符,则要查找原因并采取必要的修正措施,否则,参数估计值视为不可靠。(1)经济意义上的检验第20页,本讲稿共44页 统计检验是由统计理论决定的,其目的在于评定模型参数估计值的可靠性。应该指出、统计检验准则相对经济意义准则来说是第二位的。需要用到估计量的抽样分布或概率分布(2)统计上的检验常用的统计检验有拟合优度检验、拟合优度检验、t t检验、检验、F F检检验等。验等。第21页,本讲稿共44页 计量经济检验是由计量经济学理论确定的、主要是用来检验所采用的计量经济方法是否令人满意、计量经济方法的假设条件是否得到满足、从而确定统计检验的可靠性。(3)计量经济检验常用的检验方
9、法主要包括随机误差项的序列序列相关检验相关检验、异方差检验异方差检验、解释变量的多重共多重共线检验线检验以及随机误差项的正态分布检验正态分布检验等。第22页,本讲稿共44页为什么原假设是回归系为什么原假设是回归系数值为数值为0 0?对回归系数的检验分两种:置信区间法显著性检验法建立原假设和备择假设第23页,本讲稿共44页 变量的显著性检验变量的显著性检验 在一元线性模型一元线性模型中,就是要判断X X是否对Y Y具有显著的线性影响。这就需要进行变量的显著性检验。变量的显著性检验。计量经计学中,主要是针对变量的参数真值是计量经计学中,主要是针对变量的参数真值是计量经计学中,主要是针对变量的参数真
10、值是计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。否为零来进行显著性检验的。否为零来进行显著性检验的。否为零来进行显著性检验的。回归分析回归分析是要判断解释变量解释变量X X是否是被解释变被解释变量量Y Y的一个显著的影响因素。第24页,本讲稿共44页由于所以可构造Z统计量,但是由于未知,用其估计量代替,则我们可以构造t统计量,第25页,本讲稿共44页3.5.1 3.5.1 置信区间法置信区间法给定显著性水平置信区间置信区间置信区间置信区间检验的思想是先不去管原假设是怎样假定的,根据给定的显著性水平、自由度和样本统计量的具体值构造一个具体的置信区间。对于回归模型提出零假设和
11、备择假设,通过观察原假设所设定的参数值是否落在这个置信区间之内来做出接受接受或拒绝拒绝原假设的判断.第26页,本讲稿共44页置信区间法的检验步骤为置信区间法的检验步骤为:1.1.由于构造的是由于构造的是t t统计量统计量,根据给定的显著性水平根据给定的显著性水平5%5%和自由度和自由度n-2,n-2,首先可求出首先可求出t t统计量的统计量的95%95%的置信区间的置信区间.2.2.将将代入上式得代入上式得第27页,本讲稿共44页3.整理得这是一个随机区间,意思是抽取100个样本,按这种方法计算置信区间,将有95个区间包含真实的总体参数.4.4.根据手中的样本根据手中的样本,可计算出具体的区间
12、为可计算出具体的区间为这是一个具体的区间,它包含真实的总体参数的概率?5.5.结论:由于该置信区间没有包含原假设所设结论:由于该置信区间没有包含原假设所设定的参数值定的参数值,所以所以,拒绝原假设。拒绝原假设。第28页,本讲稿共44页3.5.2 3.5.2 显著性检验法显著性检验法 显著性显著性显著性显著性检验的思想是先姑且认为原假设是真的,然后根据该假设值,给定的显著性水平、自由度和具体的样本统计量的值,计算出t统计量的数值。根据获得这样一个t统计量数值的概率大小来决定是接受还是拒绝原假设.如果这个概率小于给定的显著性水平,就认为小概率事件发生了,拒绝原假设,认为该统计量在统计上是显著的,即
13、显著地异于0(只针对“零”零假设而言)第29页,本讲稿共44页显著性检验的步骤:显著性检验的步骤:对于回归模型对于回归模型提出零假设和备择假设:提出零假设和备择假设:给定显著性水平:给定显著性水平:1.1.根据原假设和抽取样本的统计量的值根据原假设和抽取样本的统计量的值,计算计算t t统统计量的值计量的值,根根据据得得代入代入第30页,本讲稿共44页2.2.查查t t分布表分布表,得知获此得知获此t t值的概率有多大值的概率有多大,即即P P值值在该例中,通过查表得知,在原假设成立的条件下,获在该例中,通过查表得知,在原假设成立的条件下,获得这样一个得这样一个t t值的概率只有值的概率只有0.
14、00060.00063.3.通过将获取通过将获取t t值的概率与给定的显著性水平相值的概率与给定的显著性水平相比较,决定是否拒绝原假设比较,决定是否拒绝原假设在该例中,给定的显著性水平为在该例中,给定的显著性水平为5%5%,而获取此,而获取此t t值的概率小于值的概率小于0.00060.0006,因而,也小于,因而,也小于5%5%,所以结论是拒绝原假设。,所以结论是拒绝原假设。第31页,本讲稿共44页3.6 3.6 拟合优度的检验拟合优度的检验:判定系数判定系数 当我们从总体中抽取了某个样本,根据样本拟合了回归直线后,可以发现,并不是所有的样本点都落在了样本回归直线上。问题:样本回归直线对样本
15、点的拟合优度怎问题:样本回归直线对样本点的拟合优度怎么样?如何衡量?么样?如何衡量?xY样本回归直线第32页,本讲稿共44页拟合优度检验拟合优度检验拟合优度检验拟合优度检验:对样本回归直线与样本观测值之间对样本回归直线与样本观测值之间拟合程度的检验。拟合程度的检验。问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?在满足经典线性回归模型的基本假定下,应用在满足经典线性回归模型的基本假定下,应用OLSOLS方法可以获得方法可以获得BLUEBLUE估计量,即估计量,即b1,b2b1,b2是最优线性是最优线性无偏估计量,估计量的精度用其标准误衡量。无偏估计
16、量,估计量的精度用其标准误衡量。第33页,本讲稿共44页 1.总离差平方和的分解 已知由一组样本观测值(X Xi i,Y,Yi i),i=1,2,n得到如下样本回归直线 第34页,本讲稿共44页xY第35页,本讲稿共44页 对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:因为因为所以所以又由于又由于所以所以第36页,本讲稿共44页第37页,本讲稿共44页各种符号各种符号总离差平方和总离差平方和(Total Total Sum of SquaresSum of Squares)回归平方和回归平方和(Explained Explained Sum of SquaresSum of
17、Squares)残差平方和残差平方和(Residual Residual Sum of SquaresSum of Squares )第38页,本讲稿共44页2 判定系数判定系数判定系数越接近于判定系数越接近于1 1,说明样本回归直线拟合,说明样本回归直线拟合得越好,样本回归直线解释得越好,样本回归直线解释Y Y的变异的比例越的变异的比例越高。反之,拟合得越差。高。反之,拟合得越差。第39页,本讲稿共44页区分区分:离差:变量与其均值的(偏)差离差:变量与其均值的(偏)差变异:一个变量对其均值的离差平方和变异:一个变量对其均值的离差平方和方差:指离差平方和除以适当的自由度。方差:指离差平方和除
18、以适当的自由度。第40页,本讲稿共44页3.7 3.7 回归分析结果的报告回归分析结果的报告第41页,本讲稿共44页3.9 3.9 正态性检验正态性检验3.9.1 残差直方图第42页,本讲稿共44页其原假设和备择假设如下:构造检验统计量:其中,S代表偏度,K代表峰度。3.9.3 Jarque-Bera3.9.3 Jarque-Bera检验(雅克检验(雅克贝拉统计量)贝拉统计量)在正态性假定下,JB服从自由度为2的 分布根据给定的显著性水平,查 分布表,决定拒绝还是接受原假设。第43页,本讲稿共44页3.11 3.11 预测预测对于回归方程:若已知某一家庭收入水平,比如X=78000美元,将其直接代入回归方程得这种预测叫做点预测点预测。第44页,本讲稿共44页