区间估计与假设检验 讲稿.ppt

上传人:石*** 文档编号:38901010 上传时间:2022-09-06 格式:PPT 页数:93 大小:4.41MB
返回 下载 相关 举报
区间估计与假设检验 讲稿.ppt_第1页
第1页 / 共93页
区间估计与假设检验 讲稿.ppt_第2页
第2页 / 共93页
点击查看更多>>
资源描述

《区间估计与假设检验 讲稿.ppt》由会员分享,可在线阅读,更多相关《区间估计与假设检验 讲稿.ppt(93页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、区间估计与假设检验区间估计与假设检验 第一页,讲稿共九十三页哦 经典正太线性回归模型经典正太线性回归模型 统计学预备知识统计学预备知识 区间估计基本概念区间估计基本概念回归系数回归系数1和和2的置信区间的置信区间2的置信区间的置信区间第二页,讲稿共九十三页哦一、经典正太线性回归模型一、经典正太线性回归模型所谓所谓统计推断的经典理论统计推断的经典理论由两个分支构成,即由两个分支构成,即估计估计和和假设检验假设检验。前面讨论了双变量线性回归模型的参数估计问题。用前面讨论了双变量线性回归模型的参数估计问题。用OLS方法方法,估计参数,估计参数1,2,2。在经典线性回归模型的假定下,可以。在经典线性回

2、归模型的假定下,可以证明证明 、和和 这些参数的估计量满足线性性、无偏性和最这些参数的估计量满足线性性、无偏性和最小方差(小方差(BLUE)。)。估计量的值随样本变化而变化,因此,这些估计量都是随机变量。估计量的值随样本变化而变化,因此,这些估计量都是随机变量。估计是成功的一半。假设检验是另一半。估计是成功的一半。假设检验是另一半。第三页,讲稿共九十三页哦回归分析的目的,不仅仅是估计样本回归函数,而是要用估计来对总体回归分析的目的,不仅仅是估计样本回归函数,而是要用估计来对总体回归函数进行推断。我们想知道,回归函数进行推断。我们想知道,和和 与真实的与真实的 和和 有多接近有多接近。由于由于

3、、和和 是随机变量,所以我们需要清楚它们的概率分是随机变量,所以我们需要清楚它们的概率分布,若不知其概率分布,那我们就无法将它们与其真实值相联系布,若不知其概率分布,那我们就无法将它们与其真实值相联系。第四页,讲稿共九十三页哦1.干扰项干扰项ui 的概率分布的概率分布为得到为得到OLS的概率分布,我们将专门考虑的概率分布,我们将专门考虑 :(4.1.1)其中其中假定假定X 为固定或非随机的,则条件回归分析就以为固定或非随机的,则条件回归分析就以Xi 的固定值为条件。的固定值为条件。方程(方程(4.1.1)表明,)表明,是是Yi 的一个线性函数,的一个线性函数,Y i根据假定是随机的。由于根据假

4、定是随机的。由于则则由于由于ki,系数和系数和Xi 都是固定的,所以都是固定的,所以 最终是最终是ui 的一个线性函数。的一个线性函数。第五页,讲稿共九十三页哦假定假定ui 为随机变量,则为随机变量,则 的概率分布将取决于对的概率分布将取决于对ui 的概率分布所做的概率分布所做的假定。的假定。在上一章,我们把普通最小二乘法应用于经典线性回归模型时,并没在上一章,我们把普通最小二乘法应用于经典线性回归模型时,并没有对干扰项有对干扰项ui 的概率分布做出假定。的概率分布做出假定。对这些对这些ui 所做的假定仅是所做的假定仅是:(:(1)它们它们 的期望值为零,(的期望值为零,(2)它们是不)它们是

5、不相关的,(相关的,(3)它们有一个不变的方差。有了这些假定,)它们有一个不变的方差。有了这些假定,OLS中估计量中估计量满足诸如无偏性和最小方差的统计性质。满足诸如无偏性和最小方差的统计性质。但是,我们的兴趣不仅要得到但是,我们的兴趣不仅要得到 ,还要利用它对真值,还要利用它对真值 做出推做出推断。或者说,我们的目的不仅是要得到样本回归函数,还要用它断。或者说,我们的目的不仅是要得到样本回归函数,还要用它来推测总体回归函数。来推测总体回归函数。第六页,讲稿共九十三页哦 尽管有了高斯尽管有了高斯-马尔可夫定理,但由于马尔可夫定理,但由于OLS法不对法不对ui的概率性质做的概率性质做任何假定,仍

6、难以从任何假定,仍难以从SRF去推断去推断PRF。对这一不足,在回归分析中,人们常常假定对这一不足,在回归分析中,人们常常假定ui遵从正态分布。在遵从正态分布。在第第4章中讨论的经典线性回归模型的假定中增加章中讨论的经典线性回归模型的假定中增加ui 的正态性假定,的正态性假定,就得到了所谓的就得到了所谓的 经典正态线性回归模型经典正态线性回归模型(classical normal linear regression model,CNLRM)第七页,讲稿共九十三页哦2.关于关于ui 的正态性假定的正态性假定经典正太线性回归假定每个经典正太线性回归假定每个ui 都是都是正态分布正态分布的,并且:的

7、,并且:均值:均值:方差:方差:协方差:协方差:这些假定可更简洁的表述为:这些假定可更简洁的表述为:其中其中 代表代表“其分布为其分布为”,N代表代表“正态分布正态分布”,括号中的两项,括号中的两项代表正态分布的两个参数:均值和方差。代表正态分布的两个参数:均值和方差。第八页,讲稿共九十三页哦性质:对两个正态分布变量来说,零协方差或零相关就意味着两性质:对两个正态分布变量来说,零协方差或零相关就意味着两个变量互相独立。个变量互相独立。因此,在正态性假定下,因此,在正态性假定下,ui 和和uj 协方差为零不仅意味着它们不协方差为零不仅意味着它们不相关,而且它们是独立分布的。可写成:相关,而且它们

8、是独立分布的。可写成:NID表示正态且独立分布(表示正态且独立分布(normally and independently distributed)。)。第九页,讲稿共九十三页哦为什么是正态假定?ui 代表回归模型中未明显引进的许多自变量(对因变量)的总影响。我代表回归模型中未明显引进的许多自变量(对因变量)的总影响。我们希望这些影响是微小的而且是随机的。利用统计学中著名的们希望这些影响是微小的而且是随机的。利用统计学中著名的中心极限中心极限定理(定理(central limit theorem),),就能证明,如果存在大量独立且就能证明,如果存在大量独立且相同分布的随机变量,那么随着这些变量的

9、个数无限增大,它相同分布的随机变量,那么随着这些变量的个数无限增大,它们的总和将趋向正态分布。们的总和将趋向正态分布。回顾中心极限定理。回顾中心极限定理。令令 为为n个独立的、有均值个独立的、有均值=,方差,方差=的相同的相同PDF的随机变量。令的随机变量。令 (样本均值),那么(样本均值),那么第十页,讲稿共九十三页哦2.正态分布的一个性质是,正态分布变量的任何线性函数都是正态正态分布的一个性质是,正态分布变量的任何线性函数都是正态分布的。分布的。OLS估计量估计量 和和 是是ui 的线性函数,因此,若的线性函数,因此,若ui 是正是正态分布的,则态分布的,则 和和 也是正态分布的。也是正态

10、分布的。3.正态分布是一个比较简单、仅有两个参数的分布,为人正态分布是一个比较简单、仅有两个参数的分布,为人们所熟知。们所熟知。4.如果处理小样本或有限容量样本时,比如说数据少于如果处理小样本或有限容量样本时,比如说数据少于100次观测次观测,那么正态假定就起到关键作用。它不仅有助于推导出,那么正态假定就起到关键作用。它不仅有助于推导出OLS估计量精确的概率分布,而且使我们能用估计量精确的概率分布,而且使我们能用t、F和卡方来对回归和卡方来对回归模型进行检验。模型进行检验。第十一页,讲稿共九十三页哦3.在正态性假定下在正态性假定下OLS估计量的性质估计量的性质 它们是无偏的。它们是无偏的。它们

11、有最小方差。连同性质它们有最小方差。连同性质1,就意味着它们是最小方差无偏的或者,就意味着它们是最小方差无偏的或者说它们是说它们是有效估计量有效估计量(efficient estimators)。一致性。就是说,随着样本含量无限增大,估计量将收敛到它们的一致性。就是说,随着样本含量无限增大,估计量将收敛到它们的真值。真值。(ui 的线性函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:方差:方差:或者写成:或者写成:定义标准正态化变量:定义标准正态化变量:Z服从标准正态分布,写作:服从标准正态分布,写作:第十二页,讲稿共九十三页哦第十三页,讲稿共九十三页哦5.(ui 的线性

12、函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:写成写成 令令 同样的,同样的,Z服从标准正态分布。服从标准正态分布。服从服从n-2个自由度的个自由度的 分布。分布。的分布独立于的分布独立于 。,第十四页,讲稿共九十三页哦二、统计学预备知识二、统计学预备知识统计推断点估计参数估计的一种形式。目的是依据样本参数估计的一种形式。目的是依据样本X=(X1,X2,Xn)估计总体分布估计总体分布所含的未知参数所含的未知参数或或的函数的函数 f()。一般。一般或或f()是总体的某个特征值是总体的某个特征值,如数学期望、方差、相关系数等。如数学期望、方差、相关系数等。比如令,比如令,那

13、么那么 就是真均值就是真均值 的一个估计量。比如的一个估计量。比如 。由于估计量由于估计量 仅提供仅提供 的单一一点估计值,故称点估计量的单一一点估计值,故称点估计量(point estimator)。)。1231(.)XXXXnX50X 第十五页,讲稿共九十三页哦区间估计通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数适当的区间,以作为总体的分布参数(或参数的函数或参数的函数)的真值所在范围的真值所在范围的估计。的估计。与点估计相对照,在区间估计中,我们提供真与点估计相对照,在区间估计

14、中,我们提供真将落入其间的一个可将落入其间的一个可能值域。能值域。例如,如果变量例如,如果变量X是正态分布的,则样本均值是正态分布的,则样本均值 也是正态分布的,也是正态分布的,且其均值且其均值=,方差,方差=2/n。即估计量。即估计量 的抽样或概率分布是的抽样或概率分布是 。因此我们可以构造区间:。因此我们可以构造区间:并这样的区间约有并这样的区间约有95%的概率包含真的概率包含真,那么我们正在构造着,那么我们正在构造着的一的一个个区间估计区间估计。注意上面所给的区间依据于一个样本变到另一个样本的。注意上面所给的区间依据于一个样本变到另一个样本的 ,所以是随机的。,所以是随机的。XXX第十六

15、页,讲稿共九十三页哦例如,例如,=0.05,则,则1-=0.95,意味着如果我们构造一个置信系数为,意味着如果我们构造一个置信系数为0.95的的置信区间,所构区间有置信区间,所构区间有95%的概率含有真的概率含有真时。一般的,如果置信系数是时。一般的,如果置信系数是1-,我们常说有一个,我们常说有一个100(1-)%置信区间,置信区间,就是显著性水平就是显著性水平(level of significance)。构造两个估计量构造两个估计量 和和 ,两者都是样本,两者都是样本X值的函数,使得值的函数,使得即我们可以说从即我们可以说从 到到 的区间里含有真的区间里含有真的概率是的概率是1-。此区间

16、。此区间被称为被称为的置信度为的置信度为1-的的置信区间置信区间(confidence interval),而,而1-成为成为置置信系数信系数(confidence coeffiect)。第十七页,讲稿共九十三页哦例假定总体中男子身高是正态分布的,其均值假定总体中男子身高是正态分布的,其均值=英寸且英寸且=2.5英寸。英寸。从总体中取一个从总体中取一个100人的随机样本,其平均身高为人的随机样本,其平均身高为67英寸,求总体平均英寸,求总体平均身高(身高(=)的一个)的一个95%的置信区间。的置信区间。解:由于解:由于 在本咧中在本咧中 ,查表可见:,查表可见:将给定的将给定的 ,和和n值代入

17、,就得到这个值代入,就得到这个95%的置信区间为:的置信区间为:X第十八页,讲稿共九十三页哦2.假设检验假定随机变量假定随机变量X有一已知的概率密度函数有一已知的概率密度函数f(x;),其中,其中是分布的参数,在是分布的参数,在取得一个大小为取得一个大小为n的样本之后,我们得到点估计量的样本之后,我们得到点估计量 ,由于真,由于真鲜为人知,鲜为人知,提问:这个估计量提问:这个估计量 是否与某个假设的是否与某个假设的值相符?值相符?比方说,比方说,是一个特定的(假定的)是一个特定的(假定的)数值。数值。称虚拟假设(称虚拟假设(null hypothesis),通常记为),通常记为 。与虚拟假设相

18、对的是对立假设(与虚拟假设相对的是对立假设(alternative hypothesis),通常记为),通常记为 ,可叙述为:,可叙述为:。第十九页,讲稿共九十三页哦 一个假设被称为一个假设被称为简单的简单的,如果它确定了分布的各参数的各一个值;否,如果它确定了分布的各参数的各一个值;否则就称为则就称为复合假设复合假设,例如,例如如果如果 ,并且,并且这是一个简单假设。这是一个简单假设。如果如果因为因为的值未被确定,这是一个复合假设。的值未被确定,这是一个复合假设。第二十页,讲稿共九十三页哦为了检验虚拟假设(即检验其真实性),我们利用样本信息以获得为了检验虚拟假设(即检验其真实性),我们利用样

19、本信息以获得检验统计检验统计量量(test statistic)。统计检验量常常就是未知参数的点估计量。然后我。统计检验量常常就是未知参数的点估计量。然后我们试图找出检验统计量的抽样或概率分布,并利用们试图找出检验统计量的抽样或概率分布,并利用置信区间置信区间或或显著性方显著性方法法去检验虚拟假设。去检验虚拟假设。接上例,考虑一个总体中的男子身高(接上例,考虑一个总体中的男子身高(X):):现假设现假设问题是:这个检验统计量为问题是:这个检验统计量为 的样本会来自均值为的样本会来自均值为69的总体吗的总体吗?直觉上,如果?直觉上,如果 “足够接近足够接近”,我们也许不会拒绝虚拟假设,否则我们,

20、我们也许不会拒绝虚拟假设,否则我们宁可拒绝它而接受对立假设。宁可拒绝它而接受对立假设。第二十一页,讲稿共九十三页哦因为因为 ,所以检验统计量,所以检验统计量 的分布是:的分布是:既然知道了既然知道了 的概率分布,可以根据的概率分布,可以根据 建立建立的一个的一个100(1-)置信)置信区间,然后看此置信区间是否包含区间,然后看此置信区间是否包含 。如果包含,就不拒绝虚。如果包含,就不拒绝虚拟假设;如果不包含,就可拒绝虚拟假设。拟假设;如果不包含,就可拒绝虚拟假设。例如,取例如,取=0.05,将有一个,将有一个95%的置信区间。如果此区间包含的置信区间。如果此区间包含 ,由于这,由于这样建立起来

21、的区间每样建立起来的区间每100个中有个中有95个会含有个会含有 ,我们就不拒绝虚拟假设,我们就不拒绝虚拟假设。怎样决定怎样决定 是否足够接近是否足够接近“”呢?有两种方法:呢?有两种方法:(1)置信区间法)置信区间法 (2)显著性检验法。)显著性检验法。X(1)置信区间法XXX第二十二页,讲稿共九十三页哦置信区间法操作步骤:置信区间法操作步骤:因因 ,从而,从而Zi 是一个标准正态变量,于是由正态分布表知:是一个标准正态变量,于是由正态分布表知:即即整理得:整理得:这就是这就是的一个的一个95%置信区间。一旦建立了这个区间,我们所要做的不外是置信区间。一旦建立了这个区间,我们所要做的不外是看

22、看 是否落入此区间。如果落入,就不拒绝虚拟假设,如果不落入则是否落入此区间。如果落入,就不拒绝虚拟假设,如果不落入则拒绝之。拒绝之。第二十三页,讲稿共九十三页哦例我们已建立我们已建立的一个的一个95%的置信区间,即的置信区间,即此区间显然不包含此区间显然不包含=69,因此我们能以,因此我们能以95%置信系数拒绝真置信系数拒绝真是是69的的虚拟假设。虚拟假设。落入拒绝域落入拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域第二十四页,讲稿共九十三页哦用假设检验的语言说,我们所建立的置信区间叫做用假设检验的语言说,我们所建立的置信区间叫做接受域接受域(acceptance region)。接受域以外的区域

23、叫做虚拟假设的)。接受域以外的区域叫做虚拟假设的临界域临界域(critical region)或)或拒绝域拒绝域(regions of rejection)。接受域的上下限(与拒绝域的)。接受域的上下限(与拒绝域的分界线)叫做分界线)叫做临界值临界值(critical values)。)。拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验统拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验统计量的数值的集合。如果使用样本数据时所取得的检验统计量的值计量的数值的集合。如果使用样本数据时所取得的检验统计量的值落入了概率很低的区域中,则该检验统计量不太可能具有之前假设落入了概率很低的区域

24、中,则该检验统计量不太可能具有之前假设的分布,因此原假设不太可能为真。的分布,因此原假设不太可能为真。因此,用假设检验的语言说,如果假设值落入接受区间,就不可拒因此,用假设检验的语言说,如果假设值落入接受区间,就不可拒绝虚拟假设;否则可以拒绝。绝虚拟假设;否则可以拒绝。第二十五页,讲稿共九十三页哦在决定拒绝或不拒绝在决定拒绝或不拒绝H0时,我们可能犯两类错误:时,我们可能犯两类错误:(1)拒绝一个事实上是真的)拒绝一个事实上是真的H0。第第I类错误类错误(type I error)这种当虚拟假设为真而拒绝虚拟假设的错误又称为据真错误。其概这种当虚拟假设为真而拒绝虚拟假设的错误又称为据真错误。其

25、概率通常用率通常用表示,并称为显著性水平表示,并称为显著性水平(level of significance)。(2)没有拒绝一个不真的)没有拒绝一个不真的H0。第第II类错误类错误(type II error)即接受了错误的虚拟假设。这类错误的概率记为即接受了错误的虚拟假设。这类错误的概率记为,并把不犯,并把不犯II类错误的概率类错误的概率1-称为检验的功效(称为检验的功效(power of the test)。检验的功效)。检验的功效就是它拒绝一个错误假设的能力。就是它拒绝一个错误假设的能力。自然状态自然状态决策决策H H0是对的是对的H H0是错的是错的拒绝拒绝I I类错误类错误无错无错不

26、拒绝不拒绝无错无错IIII类错误类错误第二十六页,讲稿共九十三页哦第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽可能第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽可能的做接受的推断,随之带来的就是可能把假的也当成真的接受了,这的做接受的推断,随之带来的就是可能把假的也当成真的接受了,这就导致纳伪错误的增加,即增加第二类错误发生的概率。就导致纳伪错误的增加,即增加第二类错误发生的概率。这样本容这样本容量固定的前提下,两类错误的概率不能同时减少。量固定的前提下,两类错误的概率不能同时减少。为了同时减少两类错误的概率就得增加样本容量。为了同时减少两类错误的概率就得增加样本容量。当

27、样本含量一定时,当样本含量一定时,愈大,愈大,愈小;反之,愈小;反之,愈小,愈小,愈大。愈大。第二十七页,讲稿共九十三页哦P值或准确显著性水平。值或准确显著性水平。除预选某个任定的除预选某个任定的水平外,还可求一个检验统计量的水平外,还可求一个检验统计量的p(概率概率)值值或准或准确的显著性水平。确的显著性水平。P值被定义为:虚拟假设可被拒绝时所看到的最低显著性水平。值被定义为:虚拟假设可被拒绝时所看到的最低显著性水平。假使在一项应用中我们得到一个自由度为假使在一项应用中我们得到一个自由度为20的的t值为值为3.552。从表中看。从表中看到,获得一个等于或大于到,获得一个等于或大于3.552的

28、的t值的值的p值或准确概率是值或准确概率是0.001(单尾)(单尾)或或0.002(双尾)。我们说所观测的(双尾)。我们说所观测的t值值3.552是在是在0.001或或0.002水平上统计水平上统计上显著的。上显著的。第二十八页,讲稿共九十三页哦(2)显著性检验方法回顾回顾在任一给定应用中,在任一给定应用中,和和n是已知的(或可以估计的),而真是已知的(或可以估计的),而真和和是未知是未知的。如果规定的。如果规定并在并在H0下假定下假定 ,我们就能计算出,我们就能计算出Zi,然后查,然后查正态分布表以得到所算的正态分布表以得到所算的Z值的概率。值的概率。如果是一个小的概率,比如小于如果是一个小

29、的概率,比如小于5%或或1%,就可拒绝虚拟假设,就可拒绝虚拟假设如果如果假设真实,那么获得所算的假设真实,那么获得所算的Z值的机会应该很大。值的机会应该很大。在本例中由于使用了在本例中由于使用了Z变量,故称此检验为变量,故称此检验为Z检验检验。X第二十九页,讲稿共九十三页哦例:如果如果 ,则,则Z统计量为:统计量为:查表知,超出查表知,超出3或或-3的的Z值概率约为值概率约为0.001。因此超过。因此超过-8的概率更小。因的概率更小。因此可拒绝此可拒绝=69这个虚拟假设,也就是说给定这个虚拟假设,也就是说给定=69而得到而得到 为为67的机会微乎其微。的机会微乎其微。X第三十页,讲稿共九十三页

30、哦图图A.15 Z统计量的分布统计量的分布第三十一页,讲稿共九十三页哦当我们说一个检验是显著的,通常的意思是我们可以拒绝虚拟假设。当我们说一个检验是显著的,通常的意思是我们可以拒绝虚拟假设。而而如果一个检验统计量被认为是显著的,得到它的概率等于或小于犯如果一个检验统计量被认为是显著的,得到它的概率等于或小于犯I类错类错误的概率误的概率。例如,例如,=0.05,我们知道得到一个等于,我们知道得到一个等于-1.96或或1.96的的Z值的概率是值的概率是5%。在我们的说明性例子中,在我们的说明性例子中,Z=-8,由此得到的,由此得到的Z值的概率比值的概率比2.5%小得多,小得多,大大低于预定的犯大大

31、低于预定的犯I类错误的概率。这就说明为什么所算的类错误的概率。这就说明为什么所算的Z=-8是是统计上显著的,也就是为什么拒绝统计上显著的,也就是为什么拒绝*=69这个虚拟假设。这个虚拟假设。第三十二页,讲稿共九十三页哦 )%95(96.105.051002.061.66H6cm 22011的可靠程度否定原假设即有因此这批产品不合格。,体平均数存在显著差异,说明样本平均数和总因为时,对应的临界值:;:解:选择检验统计量方法ZZZnXUcmH 某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是

32、否合格。例例第三十三页,讲稿共九十三页哦检验统计假设的步骤归纳如下:检验统计假设的步骤归纳如下:步骤步骤1.叙述虚拟假设叙述虚拟假设H0和对立假设和对立假设H1(如(如 ,)。)。步骤步骤2.选择检验统计量(如,选择检验统计量(如,)步骤步骤3.确定检验统计量的概率分布(如,确定检验统计量的概率分布(如,)。)。步骤步骤4.选定显著性水平(犯选定显著性水平(犯I类错误的概率)类错误的概率)。步骤步骤5.利用检验统计量的概率分布,建立一个利用检验统计量的概率分布,建立一个100(1-)%置信区间。置信区间。如果虚拟假设下的参数值(如如果虚拟假设下的参数值(如 )落入此置信区间即接受域,)落入此置

33、信区间即接受域,则不拒绝虚拟假设。如果落在此区间之外(即落入拒绝域),就可拒绝虚则不拒绝虚拟假设。如果落在此区间之外(即落入拒绝域),就可拒绝虚拟假设。当你拒绝一个虚拟假设时,你正冒着拟假设。当你拒绝一个虚拟假设时,你正冒着100%次的犯错误风险。次的犯错误风险。X第三十四页,讲稿共九十三页哦三、区间估计基本概念三、区间估计基本概念在重复抽样中估计值的均值可能会等于真值,(在重复抽样中估计值的均值可能会等于真值,(),但由于抽),但由于抽样波动,单一估计值很可能不等于真值。样波动,单一估计值很可能不等于真值。在统计学中,一个点估计量的可靠性由它的标准误差来衡量。因此,我们在统计学中,一个点估计

34、量的可靠性由它的标准误差来衡量。因此,我们不能完全信赖一个点估计值,而是要围绕点估计量来构造一个区间。不能完全信赖一个点估计值,而是要围绕点估计量来构造一个区间。如,在点估计量的两旁各划出宽为如,在点估计量的两旁各划出宽为2或或3个标准误的一个区间,使得个标准误的一个区间,使得它有它有95%的概率包含着真实的参数值。这就是区间估计的粗略概念。的概率包含着真实的参数值。这就是区间估计的粗略概念。第三十五页,讲稿共九十三页哦假定我们想知道假定我们想知道 离离 有多有多“近近”,可以试求两个正数,可以试求两个正数 和和 ,位于位于0与与1之间,使得随机区间之间,使得随机区间(random inter

35、val)包含包含 的概率为的概率为1-。用符号表示:。用符号表示:这样一个区间存在的话,就称之为这样一个区间存在的话,就称之为置信区间置信区间(confidence interval);1-称置信系数称置信系数(confidence coefficient);而;而(0 1)称显著性水平)称显著性水平(level of significance)。)。置信区间的端点称为置信区间的端点称为临界值临界值(critical value)。)。为置信下限,为置信下限,为置信上限。为置信上限。(5.2.1)第三十六页,讲稿共九十三页哦注意:注意:(5.2.1)中的区间是一个随机区间;它从给一个样本变到另

36、一个样)中的区间是一个随机区间;它从给一个样本变到另一个样本,因为它是根据本,因为它是根据 来构造的,来构造的,是随机的。是随机的。如果在重复抽样中,像(如果在重复抽样中,像(5.2.1)那样,在)那样,在1-的概率基础上构造置信的概率基础上构造置信区间多次,那么从长期看,平均的说,这些区间将有区间多次,那么从长期看,平均的说,这些区间将有100%(1-)次)次包含着参数的真值。包含着参数的真值。只要只要 尚不知道,区间(尚不知道,区间(5.2.1)就是随机的。但是,一旦我们有了一个特)就是随机的。但是,一旦我们有了一个特定的样本并获得定的样本并获得 的一个特定的数值,区间(的一个特定的数值,

37、区间(5.2.1)就不再是随机的,而)就不再是随机的,而是固定的了。这时,我们不能说一个给定了的是固定的了。这时,我们不能说一个给定了的固定固定区间包含真实区间包含真实 的概的概率是率是1-。在这种情况下,。在这种情况下,要么落入这个固定区间内要么落在区要么落入这个固定区间内要么落在区间外,概率只能是间外,概率只能是1或或0.比如,求得比如,求得95%置信区间是置信区间是 ,我们,我们 就不可以说这个区间包含真实就不可以说这个区间包含真实 的概率是的概率是95%。这个概率。这个概率 不是不是1就是就是0.2(0.42680.5914)第三十七页,讲稿共九十三页哦四、四、2的置信区间的置信区间在

38、正态性假定下,变量:在正态性假定下,变量:遵循自由度为遵循自由度为n-2的的 分布。(卡特希尔分布。(卡特希尔P73)回顾令回顾令 为独立标准化正态变量(零均值,单为独立标准化正态变量(零均值,单位方差),则量:位方差),则量:遵从遵从k个自由度个自由度(df)的的 分布,这里分布,这里df一词指上述一词指上述 总和中独立总和中独立的量的个数。的量的个数。(5.4.1)第三十八页,讲稿共九十三页哦其中居于双重不等式中间的其中居于双重不等式中间的 值由(值由(5.4.1)给出,而)给出,而 和和 是得自是得自 数值表中自由度为数值表中自由度为n-2的两个的两个 值(临界值),使得它们各切去值(临

39、界值),使得它们各切去 分布的分布的100(1-)%的尾部面积。如图。整理得:的尾部面积。如图。整理得:这就给出这就给出2的的100(1-)%置信区间。置信区间。第三十九页,讲稿共九十三页哦第四十页,讲稿共九十三页哦例:对于自由度为对于自由度为8的的 表给出下列临界值;表给出下列临界值;(表示(表示 值超过值超过17.5346的概率是的概率是2.5%)因此根据因此根据得得第四十一页,讲稿共九十三页哦五、回归系数五、回归系数1和和2的置信区间的置信区间1.2的置信区间的置信区间在在ui 的正态性假定下,的正态性假定下,OLS估计量估计量 和和 本身就是正态分布的。因本身就是正态分布的。因此,以此

40、,以 为例,变量为例,变量是一个标准正态化变量。如果真实的总体方差是一个标准正态化变量。如果真实的总体方差 已知,可利用正态分已知,可利用正态分布对布对2做概率性表达。但是做概率性表达。但是 很少知道,在实践中用无偏很少知道,在实践中用无偏估计量估计量 来测定。来测定。(5.3.1)第四十二页,讲稿共九十三页哦如果用如果用 代替代替,(,(5.3.1)可写成:)可写成:证明见后,这样定义的证明见后,这样定义的t变量遵循自由度为变量遵循自由度为n-2的的t分布。分布。注意(注意(5.3.2)和()和(5.3.1)的区别,我们不用正态分布,而是用)的区别,我们不用正态分布,而是用t分布来分布来建立

41、建立2的置信区间,如下:的置信区间,如下:是由显著水平为是由显著水平为/2和自由度为和自由度为n-2的的t分布给出的分布给出的t变量值,常变量值,常常被称为在常被称为在/2显著水平上的临界值。显著水平上的临界值。估计量 参数估计量的标准误差的估计值第四十三页,讲稿共九十三页哦 回顾回顾t分布分布如果如果Z1 是一标准化正态变量,而另一变量是一标准化正态变量,而另一变量Z2 遵从自由度为遵从自由度为k的的 分布且独立于分布且独立于Z1,则如下定义的变量:,则如下定义的变量:令令第四十四页,讲稿共九十三页哦12222222222222222/(2)()(2)/(2)()var()iiZtZnxnn

42、xse第四十五页,讲稿共九十三页哦重新整理得:重新整理得:更简洁的写成,更简洁的写成,2 2的一个的一个100100(1-1-)%置信区间:置信区间:第四十六页,讲稿共九十三页哦类似地,可以写出:类似地,可以写出:或写成,或写成,1 1的一个的一个100100(1-1-)%置信区间:置信区间:注意给出的注意给出的 1 1和和 2 2的置信区间有一重要特点:的置信区间有一重要特点:置信区间的宽度与估计量的标准误差成比例。标准误差越大,置信区置信区间的宽度与估计量的标准误差成比例。标准误差越大,置信区间越宽,对未知参数的真值进行估计的不确定性越大。因此估计量的间越宽,对未知参数的真值进行估计的不确

43、定性越大。因此估计量的标准误差被喻为估计量的精度。标准误差被喻为估计量的精度。第四十七页,讲稿共九十三页哦例:若取若取=5%,求,求 2 2的置信区间。的置信区间。解:查表得,解:查表得,2 2的的95%置信区间应该为置信区间应该为即即 或或/20.025(8)(8)2.306tt20.5091 2.306*0.03570.5091 2.306*0.0357第四十八页,讲稿共九十三页哦对这个置信区间的解释是:对这个置信区间的解释是:给定置信系数给定置信系数95%,从长远看,在类似于(,从长远看,在类似于(0.4268,0.5914)的每)的每100个区间中,将有个区间中,将有95个包含着真实个

44、包含着真实 2 2值。值。但要注意,我们不可以说,这个特定的区间有但要注意,我们不可以说,这个特定的区间有95%的概率包含着真的概率包含着真实的实的 2 2,因为这个区间已经固定而不再是随机的了,那么,因为这个区间已经固定而不再是随机的了,那么,2 2要么落入其中要么落入其中,要么落在其外。因此,这个给定的固定区间包含着真实的,要么落在其外。因此,这个给定的固定区间包含着真实的 2 2的概率不是的概率不是1就是就是0.第四十九页,讲稿共九十三页哦2.1的置信区间的置信区间仿照上例,容易证实,在仿照上例,容易证实,在消费消费收入一例收入一例中,中,1 1的的95%的置信区间的置信区间是:是:即即

45、仍需留意,每仍需留意,每100个区间中有个区间中有95个将包含真实的个将包含真实的 1 1;但这个特殊的固定;但这个特殊的固定区间含有区间含有 1 1的概率则是的概率则是1 1或或0.0.第五十页,讲稿共九十三页哦六、假设检验六、假设检验一般地,假设有三种形式:(1 1)双侧检验)双侧检验:H0:0;H1:0 (2 2)左侧检验)左侧检验:H0:0;H1:0 或 H0:0;H1:0 或 H0:0 第五十一页,讲稿共九十三页哦假使我们公设:假使我们公设:就是说在虚拟假设下就是说在虚拟假设下MPC是是0.3,而在对立假设下,而在对立假设下MPC大于或小于大于或小于0.3.对立假对立假设是一个复合假

46、设,就是设是一个复合假设,就是双侧假设(双侧假设(two-sided hypothesis)。这样的双侧假设。这样的双侧假设,常常反映着我们对于对立假设偏离虚拟假设的方向没有一个强有力的先验性或,常常反映着我们对于对立假设偏离虚拟假设的方向没有一个强有力的先验性或理论性期望。理论性期望。双侧或双尾检验双侧或双尾检验第五十二页,讲稿共九十三页哦所观测的所观测的 是否与是否与H0 相符?相符?引入置信区间。在重复抽样意义下,置信区间以引入置信区间。在重复抽样意义下,置信区间以95%的置信系数给出真值的置信系数给出真值 落入其中的一个范围或界限,从而给出了可信的虚拟假设的一个集合。落入其中的一个范围

47、或界限,从而给出了可信的虚拟假设的一个集合。虚拟假设的虚拟假设的 落入这个落入这个100100(1-1-)%置信区间,我们就不拒绝虚拟假设置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可拒绝虚拟假设。;如果它落在区间之外,我们就可拒绝虚拟假设。决策规则:构造一个决策规则:构造一个 的的100100(1-1-)%置信区间。如果置信区间。如果 在假设在假设H0 下下落入此区间,就不要拒绝落入此区间,就不要拒绝H0。但如果它落在此区间之外,就要拒绝。但如果它落在此区间之外,就要拒绝H0。第五十三页,讲稿共九十三页哦在假设在假设H0 下,落入此区间的下,落入此区间的 值有值有100100(

48、1-1-)%可信性。因而,若可信性。因而,若 果果真落入此域,就不拒绝真落入此域,就不拒绝H0.第五十四页,讲稿共九十三页哦拿人为的例子来说:拿人为的例子来说:置信区间:置信区间:显然落在给出的显然落在给出的95%置信区间之外,因此我们能以置信区间之外,因此我们能以95%的置信度拒的置信度拒绝绝MPC的真值是的真值是0.3的假设。即使虚拟假设是真的,我们得到一个大到的假设。即使虚拟假设是真的,我们得到一个大到0.5914的的MPC值,最多也只有值,最多也只有5%的机会,这是一个小概率。的机会,这是一个小概率。第五十五页,讲稿共九十三页哦在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统计上

49、显著的。在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统计上显著的。反之,当我们不拒绝虚拟假设时,我们说我们的发现不是统计上显著的。反之,当我们不拒绝虚拟假设时,我们说我们的发现不是统计上显著的。一些作者使用一些作者使用“统计上高度显著统计上高度显著”一词。该词通常是指,当他们拒绝虚拟假一词。该词通常是指,当他们拒绝虚拟假设时,犯设时,犯I类错误的概率是一个小数,通常指类错误的概率是一个小数,通常指1%。但在后面我们对。但在后面我们对p值值的讨论将表明,较好的做法是,让研究者自己去决定一个统计上的发现的讨论将表明,较好的做法是,让研究者自己去决定一个统计上的发现,究竟是,究竟是“显著的显

50、著的”、“中度显著的中度显著的”,还是,还是“高度显著的高度显著的”。第五十六页,讲稿共九十三页哦七、假设检验:显著性检验法七、假设检验:显著性检验法检验回归系数的显著性:检验回归系数的显著性:t检验检验显著性检验,是利用样本结果来证实一个虚拟假设的真伪的一种检显著性检验,是利用样本结果来证实一个虚拟假设的真伪的一种检验程序。验程序。显著性检验的基本思想在于一个检验统计量(作为估计量)显著性检验的基本思想在于一个检验统计量(作为估计量)以及在虚拟假设下,这个统计量的抽样分布。根据手中数据以及在虚拟假设下,这个统计量的抽样分布。根据手中数据算出的统计量的值决定是否接受算出的统计量的值决定是否接受

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁