《第二 计量经济学的统计学基础.pptx》由会员分享,可在线阅读,更多相关《第二 计量经济学的统计学基础.pptx(129页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、解决问题的思路1恳请同学们将数理统计学的书籍拿出来进行复习。2在老师讲授的内容的同时,加强回顾,多思考,多提问。3掌握Windows 9x以及Office的应用,为毕业论文和大四谋业面试打下坚实的基础。4熟悉Internet的使用,逐步养成通过网络了解世界与世界同步。第1页/共129页主要内容第一节第一节 总体、样本和随机函数总体、样本和随机函数第二节第二节 对总体的描述对总体的描述随机变量的数字特征随机变量的数字特征第三节第三节 对样本的描述对样本的描述样本分布的数字特征样本分布的数字特征第四节第四节 随机变量的分布随机变量的分布总体和样本的连接点总体和样本的连接点第五节第五节 通过样本,估
2、计总体(一)通过样本,估计总体(一)估计量的特估计量的特征征第六节第六节 通过样本,估计总体(二)通过样本,估计总体(二)估计方法估计方法第七节第七节 通过样本,估计总体(三)通过样本,估计总体(三)假设检验假设检验 第2页/共129页数理统计学在计量经济学中的地位事实上不懂得数理统计学就不可能学习和研究计量经济学。事实上不懂得数理统计学就不可能学习和研究计量经济学。数理统计学是计量经济学的基础,它为计量经济学提供了唯一而有效的方法。数理统计学是计量经济学的基础,它为计量经济学提供了唯一而有效的方法。此外,从某种意义上来说,计量经济学就是使数理统计学在建立经济模型中得以应用的一门科学。此外,从
3、某种意义上来说,计量经济学就是使数理统计学在建立经济模型中得以应用的一门科学。第3页/共129页复习数理统计学必须注意建议同学们将已经学过的建议同学们将已经学过的西方经济学西方经济学、数理统计学数理统计学、线性代线性代数数和和Windows Windows 进行一次认真地复习。进行一次认真地复习。复习时,注重西方经济学的宏观部分,注重数理统计学学科体系的逻辑结复习时,注重西方经济学的宏观部分,注重数理统计学学科体系的逻辑结构分析、注重数理统计方法的阐述、注重数理统计公式、定义和定理的内构分析、注重数理统计方法的阐述、注重数理统计公式、定义和定理的内在涵义及其相互关系,注重线性代数的求逆和相似形
4、部分,注重在涵义及其相互关系,注重线性代数的求逆和相似形部分,注重Windows Windows 的基本操作部分。的基本操作部分。在今后的学习中,注意经济学基本理论及其应用,注意数理统计学基础与在今后的学习中,注意经济学基本理论及其应用,注意数理统计学基础与计量经济学的联系与活用,注意线性代数与统计量的计量与检验。计量经济学的联系与活用,注意线性代数与统计量的计量与检验。第4页/共129页第一节 总体、样本和随机函数四个基本定义与数理统计学的逻辑结构四个基本定义与数理统计学的逻辑结构一、随机变量的分布一、随机变量的分布二、二元随机变量二、二元随机变量三、独立性三、独立性四、随机变量函数和分布四
5、、随机变量函数和分布第5页/共129页四个基本定义与数理统计学的逻辑结构总体和个体样本和样本容量随机变量统计量数理统计学的逻辑结构第6页/共129页总体(集合)和个体(构成集合的元素)研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。注意:(1)按组成总体个体的多寡分为:有限总体和无限总体;(2)总体具有同质性:每个个体具有共同的观察特征,而与其它总体相区别;(3)度量同一对象得到的数据也构成总体,数据之间的差异是绝对的,因为存在不可消除的随机测量误差;(4)个体表现为某个数值是随机的,但是,它们取得某个数值的机会是不同的,即它们按一定的规律取值,即它们的取值与确定的概率相对应。第
6、7页/共129页样本和样本容量总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。注意:抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。第8页/共129页随机变量根据概率不同而取不同数值的变量称为随机变量(Random Variable)。注意:(1)一个随机变量具有下列特性:RV可以取许多不同的数值,取这些数值的概率为p,p满足:0=p=1。(2)随机变量以一定的概率取到各种可能值,按其取值情况随机变量可分为两类:离散型随机变量和连续型随机变量。离散型随机变量的取值最多可列多个;连续型随机变量的取值充满整个数轴或者某个区间。(3)本
7、书中,随机变量用x、y、等符号表示第9页/共129页离散型随机变量与连续型随机变量 10 20 30 40 501.0概率概率xx1.0离散型随机变量连续型随机变量第10页/共129页总体与随机变量的关系表示总体状况的数量特征,在总体中是参差不齐的,往往以一定的概率取表示总体状况的数量特征,在总体中是参差不齐的,往往以一定的概率取不同的数值,显然对于这样的数值我们采用一般的变量是无法加以描述的。不同的数值,显然对于这样的数值我们采用一般的变量是无法加以描述的。但是。可以采用一种特殊的变量来表示它们。这个特殊变量就是随机变量。但是。可以采用一种特殊的变量来表示它们。这个特殊变量就是随机变量。因为
8、,根据随机变量的定义,随机变量以一定的概率取许多不同的值,而因为,根据随机变量的定义,随机变量以一定的概率取许多不同的值,而且概率且概率p p满足:满足:0=p=10=p=1。例如,一批灯泡的寿命可以取许多不同的数值,。例如,一批灯泡的寿命可以取许多不同的数值,每个灯泡的取值不一定完全相同,但它们是按一定概率进行分布的,但它每个灯泡的取值不一定完全相同,但它们是按一定概率进行分布的,但它们却是以一定的概率取某个寿命值。由此看来,随机变量并不是一个随便们却是以一定的概率取某个寿命值。由此看来,随机变量并不是一个随便变的量。变的量。由于我们主要研究总体的数量特征,可以直接用随机变量来表示所研究的由
9、于我们主要研究总体的数量特征,可以直接用随机变量来表示所研究的总体。总体。第11页/共129页总体、随机变量、样本间的联系总体就是一个随机变量,所谓样本就是n个(样本容量n)相互独立且与总体有相同分布的随机变量x1,xn。每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(X1,Xn)。通过总体的分布可以把总体和样本连接起来。第12页/共129页从两个角度来描述总体(随机变量)中个体的取值(1 1)动态)动态概率概率随机地选取一个个体取某个具体数值的随机地选取一个个体取某个具体数值的可能性;可能性;(2 2)静态)静态分布分布个体取某个数值,从全局来看这个具体个体取某个数值,从全局来
10、看这个具体的数值(可能不只一个个体取这同一个数值)出现的次数占全的数值(可能不只一个个体取这同一个数值)出现的次数占全体个体个数的比例,形象地说就是这个具体的数值在数轴的这体个体个数的比例,形象地说就是这个具体的数值在数轴的这个位置上分布了多少。个位置上分布了多少。分布也好、概率也好它们在度量上是一致的。分布也好、概率也好它们在度量上是一致的。这只是就离散型随机变量的通俗示意。这只是就离散型随机变量的通俗示意。第13页/共129页总体分布是总体和样本的连接点所谓分布,它是从全局而言的。通俗地说,分布就所谓分布,它是从全局而言的。通俗地说,分布就是某个对象在什么地方,堆积了多少。是某个对象在什么
11、地方,堆积了多少。任何一个随机变量都有自己的分布,这个什么地方任何一个随机变量都有自己的分布,这个什么地方就是在数轴上取什么值,堆积多少就是在那里占有就是在数轴上取什么值,堆积多少就是在那里占有的比例是多少或者概率有多大。的比例是多少或者概率有多大。总体可以表示为随机变量,并具有自身的分布。总体可以表示为随机变量,并具有自身的分布。样本则是相互独立与总体具有相同分布的样本则是相互独立与总体具有相同分布的n n元随机变元随机变量。因此,总体分布是总体和样本的连接点。从而,量。因此,总体分布是总体和样本的连接点。从而,可以通过对样本特征的研究达到对总体进行研究的可以通过对样本特征的研究达到对总体进
12、行研究的目的。因为它们具有相同的分布。目的。因为它们具有相同的分布。须知,如果对于一个随机变量完全掌握了它的分布须知,如果对于一个随机变量完全掌握了它的分布规律,就完全明白无误了。规律,就完全明白无误了。第14页/共129页为什么样本是与所来自的总体具有相同的分布的随机变量因为样本具有二重性:因为样本具有二重性:一是指某一次具体的抽样的具体的数值(一是指某一次具体的抽样的具体的数值(X1X1,XnXn););二是指一次抽样的可能结果,它的每一次观察都是随机地从总体中(每一二是指一次抽样的可能结果,它的每一次观察都是随机地从总体中(每一个个体有同样的机会被选入)抽取一个,所以它是一组随机变量(个
13、个体有同样的机会被选入)抽取一个,所以它是一组随机变量(x x1 1,x x2 2,x xn n)而且,每一次抽样都来自同一总体(分布),也就是每一次抽样都带来了而且,每一次抽样都来自同一总体(分布),也就是每一次抽样都带来了与总体一样的分布信息。所以,样本与所来自的总体分布相同。与总体一样的分布信息。所以,样本与所来自的总体分布相同。由于总体分布完整的描述了总体的信息,有时我们也直呼总体为分布,不由于总体分布完整的描述了总体的信息,有时我们也直呼总体为分布,不加区别地使用总体或分布。加区别地使用总体或分布。第15页/共129页统计量设(x1,x2,xn)为一组样本观察值,函数f(x1,x2,
14、xn)若不含有未知参数,则称为统计量。统计量一般是连续函数。由于样本是随机变量,因而它的函数也是随机变量,所以,统计量也是随机变量。统计量一般用它来提取或压榨由样本带来的总体信息。第16页/共129页样本与总体之间的关系样本是总体的一部分,是对总体随机抽样后得到的集合。对观察者而言,总体是不了解的,了解的只是样本的具体情况。我们所要做的就是通过对这些具体样本的情况的研究,来推知整个总体的情况。Xn+1XnX1样本总体第17页/共129页数理统计学的逻辑结构(1 1)总体和样本)总体和样本引入一个随机变量来描述总体引入一个随机变量来描述总体(2 2)对总体的描述:随机变量的数字特征)对总体的描述
15、:随机变量的数字特征(3 3)对样本的描述:样本分布的数字特征)对样本的描述:样本分布的数字特征(4 4)总体与样本的连接点:随机变量的分布)总体与样本的连接点:随机变量的分布(5 5)如何用样本的数字特征估计总体的数字特征及)如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数数据生成过程中的各种参数 a a 估计量的优良性估计量的优良性 b b 估计方法估计方法 c c 对估计量的检验对估计量的检验假设检验假设检验第18页/共129页a 估计量的优良性1、无偏性2、有效性3、均方误最小4、一致性第19页/共129页b 估计方法 矩法矩法最大似然法最大似然法最小二乘法最小二乘法最
16、小卡平方法最小卡平方法总体分布未知总体分布未知正态总体正态总体一般总体(大样)一般总体(大样)已知方差已知方差方差未知方差未知一般总体(大样)一般总体(大样)正态总体正态总体估计期估计期望望单个总体单个总体两个总体两个总体估计方差(常用小样本下,正态总体估计估计方差(常用小样本下,正态总体估计其它参数)其它参数)点估计点估计区间估计区间估计第20页/共129页c 对估计量的检验假设检验1.对总体分布特征的假设检验(1)一个正态总体的假设检验a 检验均值:已知方差和未知方差b 检验方差:未知均值(双尾和单尾)(2)两个正态总体的假设检验a 检验均值:未知方差但可假设其相等b 检验方差:未知均值(
17、双尾和单尾)(3)总体分布的假设检验a 总体为离散型分布b 总体为连续型分布2.对各种系数、参数估计值的假设检验第21页/共129页一、随机变量的分布第22页/共129页(一)离散型随机变量的分布定义:如果随机变量 只取有限个或可列多个可能值,而且 以确定的概率取这些值,则称 为离散型随机变量。通常用分布列表示离散型随机变量:的概率分布也可用一系列等式表示:P(=xi)=pi (i=1,2,)称为 的概率函数。注意这里xi只出现一次。显然满足概率的定义:离散型随机变量的分布就是指它的分布列或概率函数。第23页/共129页离散型随机变量举例1例1 一批产品的废品率为5%,从中任取一个进行检验,以
18、随机变量来描述这一试验并写出的分布。以X=0表示“产品为合格产品”,X=1表示“产品为废品”,那么分布列如下:其概率函数p(X=0)=0.95,p(X=1)=0.05,或p(X=i)=(0.05)i(0.95)1-i (i=0,1)第24页/共129页离散型随机变量举例2用随机变量X描述掷一颗骰子的试验。分布的概率函数为:P(X=i)=1/6(i=1,2,3,4,5,6)第25页/共129页(二)随机变量的分布函数定义:若X是一个随机变量(可以是离散的,也可以是非离散的),对任何实数x,令F(x)=P(X=x),称F(x)为随机变量X的分布函数。F(x),即事件“X=x”的概率,是一个实函数。
19、对任意实数x1x2,有P(x1Xx2)=P(X=x2)-P(X=x1)=F(x2)-F(x1)由此可知,若已知X的分布函数,就知道X在任何区间上取值的概率。所以,分布函数完整的描述了随机变量的变化情况。x2x2f(x)F(x)Xx1x1第26页/共129页分布函数F(x)的性质第27页/共129页分布函数举例例3 求例1中的分布函数例4 求例2中的分布函数01F(x)x第28页/共129页(三)连续型随机变量的分布定义:对于任何实数x,如果随机变量X的分布函数F(x)可以写成概率分布密度函数的性质:第29页/共129页为什么(x)称为概率分布密度函数第30页/共129页连续型随机变量分布函数举
20、例a x ba x bF(x)(x)第31页/共129页(四)分布函数、概率函数、密度函数三者的关系分布函数既适用于离散型也适用于连续型,是描述各种类型随机变量最一般的共同形式。但是,它不够直观。概率函数对于离散型的描述很直观。概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比分布函数更直观。所以,在实际应用中我们分别用概率函数和密度函数对离散型和连续型随机变量进行描述。第32页/共129页二、二元随机变量n元随机变量的定义:每次试验同时处理n个随机变量(X1,X2,Xn),它们的取值随试验的进行而变化。如果对任何一组实数(x1,x2,xn),事件“X1 x1,X2 x2,Xn xn
21、”有着确定的概率,则称n个随机变量(X1,X2,Xn)总体为一个n元随机变量。n元随机变量分布函数的定义:n元函数F(x1,x2,xn)=P(X1 x1,X2 x2,Xn xn)(x1,x2,xn)属Rn,为n元随机变量分布函数。离散二元随机变量的定义:如果二元随机变量(X,Y)所有可能取值为有限或可列多个,并且以确定的概率取各个不同数值,则称(X,Y)为二元随机变量。第33页/共129页(X,Y)的联合分布表和联合分布函数(X,Y)为离散型的二元随机变量,通常用联合分布函数与联合分布表表示。第34页/共129页离散二元分布函数的示例例6 同一品种的5个产品中,有2个正品,3个次品,每次从中抽
22、取一个进行质量检查,不放回的抽取,连续两次。令“Xi=0”表示第i次抽取到正品,而“Xi=1”表示第i次抽取到次品,写出(X1,X2)的分布。解 p(X1=0,X2=0)=p(X1=0)P(X2=0)=(2/5)(1/4)=1/10 p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10 p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10 p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10第35页/共129页连续二元随机变量的定义第36页/共129页三、独立性(一)事件的独立性(二)随机变量
23、的独立性第37页/共129页(一)事件的独立性定义1.12事件的独立性的定义如果事件A发生的可能性不受事件B发生与否的的影响,即P(A/B)=P(A),则称事件A对于事件B独立。显然,若事件A对于事件B独立,事件B对于事件A也一定独立,我们称事件A与事件B相互独立。A与B独立的充分必要条件是:P(AB)=P(A)P(B)第38页/共129页(二)随机变量的独立性定义1.13随机变量相互独立的定义 对于任何实数x,y,如果二元随机变量(X,Y)的联合分布函数F(x,y)等于X和Y的边际分布的乘积,即 F(x,y)=FX(x).FY(y)则称X与Y相互独立。定义1.14边际分布的定义离散型二元随机
24、变量(X,Y)中,分量X(或Y)的概率分布称为(X,Y)的关于X(或Y)的边际分布,边际分布又称边缘分布。第39页/共129页四、随机变量函数的概念和分布定义1.15 随机变量函数的定义 设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。我们常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与
25、之有关的其它随机变量的分布。其间的关系通常用函数关系表示。第40页/共129页第二节 对总体的描述随机变量的数字特征一、数学期望二、方差三、数学期望与方差的图示第41页/共129页一、数学期望研究数字特征的必要性两个最重要的数字特征(1)数学期望(2)方差第42页/共129页研究数字特征的必要性总体就是一个随机变量。对总体的描述就是对随机变量的描述。随机变量的分布就是对随机变量最完整的描述。但是,(1)求出总体的分布往往不是一件容易的事情;(2)而且,在很多情况下,我们并不需要全面考察随机变量的变化情况,只需要了解总体的一些综合指标。一般说来,常常需要了解总体的一般水平和它的离散程度;(3)如
26、果了解总体的一般水平和离散程度,就已经对总体有了粗略的了解了;(4)在很多情况下,了解这两个数字特征还是深入求出总体分布的基础和关键。由此看来,研究随机变量的数字特征是十分必要的。第43页/共129页数学期望的定义定义2.1离散型随机变量数学期望的定义假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下:数学期望描述的是随机变量(总体)的一般水平。定义2.2连续型随机变量数学期望的定义第44页/共129页女儿期待父亲钓多少鱼回家?女儿期待父亲钓多少鱼回家?数学期望是最容易发生的,因而是可以期待的。它反映数据
27、集中的趋势。第45页/共129页数学期望的性质(1)如果a、b为常数,则 E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y)第46页/共129页求离散型随机变量数学期望举例例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.
28、1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 EXEY 乙射手射击水平比较高 二人各发一弹,得分总和最可能在4.3分左右(即4分或5分)第47页/共129页二、方差定义2.4 离均差的定义 如果随机变量X的数学期望E(X)存在,称X-E(X)为随机变量X的离均差。显然,随机变量离均差的数学期望是0,即 E X-E(X)=0定义2.3 连续型随机变量的方差定义2.5 随机变量离均差平方的数学期望,叫随机变量的方差,记作Var(x),或D(x)。方差的算术平方根叫标准差。第48页/共129页方差的意义(1)离均差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程
29、度,这种偏差越大,表明变量的取值越分散。(2)一般情况下,我们采用方差来描述离散程度。因为离均差的和为0,无法体现随机变量的总离散程度。事实上正偏差大亦或负偏差大,同样是离散程度大。方差中由于有平方,从而消除了正负号的影响,并易于加总,也易于强调大的偏离程度的突出作用。第49页/共129页方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,x,y为两个相互独立的随机变量,则(ax+b
30、y)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2第50页/共129页例2 计算本节例1中甲射手的方差例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:E(X)=2.1Var(X)=(-1.1)2 0.4+(-0.1)2 0.1+0.92 0.5 =0.89第51页/共129页三、数学期望与方差的图示数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。1方差同、期望变大 2期望同、方差变小51055第52页/共129页第三节 对样本的描述样本分布的数字特征一、样本分布函数二、样本平均数三、样本方差第53页/共129页一、样本分布函数
31、第54页/共129页样本分布函数举例第55页/共129页二、样本平均数总体的数字特征是一个固定不变的数,称为参数;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。定义3.1样本平均数的定义样本平均数用来描述样本的平均水平(一般Common)水平。第56页/共129页三、样本方差和标准差定义3.2 样本方差和标准差的定义第57页/共129页第四节 随机变量的分布总体和样本的连接点一、几种重要的分布二、各种分布之间的联系三、分布是总体和样本之间的连接点学习的重点应放在确定X服从什么分布,和各种分布的联系上。第58页/共129页一、几种重要的分布如果一个随机变量的分布已经确定,那么这个
32、随机变量的一切性质对于我们便都是已知的。因为随机变量的分布是对随机变量最完整的描述。例如X是广西十万大山中树木的高度,它的分布函数为F(x)=P(X 时,MSE()=0,亦即Var()=0和Bias()2=0,也就是随着样本加大,的方差变小;的偏差接近于0,这就是一致性描述的情况。事实上一致性和MSE()=0(当n=)这两条标准在计量经济学中往往是通用的。第100页/共129页N小N大N极大小的概率第101页/共129页第六节 通过样本,估计总体(二)估计方法一、点估计(1)矩法(2)最大似然法(3)最小二乘法二、区间估计(一)对总体期望值的估计(二)对总体方差的估计(三)关于区间估计的几点说
33、明第102页/共129页一、点估计所谓点估计就是给出被估计参数的一个特定的估计值。常用的点估计方法有四种:矩法、最大似然法、最小二乘法和X2法。这四种方法分别建立在不同的原则上。对同一样本根据四种方法估计同一参数,所获得的估计结果可能互不相同。然而由于各种建立原则的合理性,所以四种方法在研究中都经常使用。第103页/共129页(1)矩法矩法是求估计量最古老的方法。具体作法是:一样本矩作为相应总体矩的估计量;以样本矩的函数作为相应的总体矩同样函数的估计量。这种方法最常见的应用是用样本平均数估计总体数学期望。矩法比较直观,求估计量时有时也比较直接,但它求出的估计量往往不够理想。第104页/共129
34、页矩法点估计的例题例1某灯泡厂某天生产了一大批灯泡,从中抽取了0个进行寿命试验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿命是多少?第105页/共129页(2)最大似然法(Maximum Likelihood Estimation)1、一个重要的事实2、最大似然法的概念3、似然法函数4、最大似然法的定义5、最大似然法的三个示例第106页/共129页1、请注意如下事实不同的总体会产生不同的样本,对于某一特定的样本,在我等不了解产生它的母体究竟为何物的观察者眼中,它来自一些母体的可能性要比来自另一些母体的可能性大,即一些母体更容易产生出我们所观察到的样本。举例说,假定我们抽取到(x1,x
35、2,x8)我们知道它来自正态总体,且总体的方差是了解的,但是总体的均值未知。如下图所示。x6 x2 x3 x4 x5 x6 x7 x8 分布B分布A概率x假定样本不是来自B就是来自A。如果样本来自B,观察到它的可能性非常小;真正的母体若是A,得到样本的可能性很大。显然我们宁愿承认样本来自A。是样本“替”我们“选择”了A。第107页/共129页2、最大似然法的概念上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自的总体当作产生样本的总体。现在要根据从总体中抽取得到的样本(x1,xn)对总体中的未知数进行估计。最大似然法是选择这样的估计量作为的估计值,以便使观察结果(x1,xn)出现的可能性(概
36、率)最大。对于离散型变量,就是要选择使p(x1)p(x2)p(xn)最大。(连乘表示一次独立地抽取各个样本观察值)对于连续型变量,就是要选择使(x1)(x2).(xn)最大。注意(xi)是随机变量在xi附近取值的概率,相当于离散型的p(xi)。第108页/共129页3、似然法函数第109页/共129页4、最大似然法的定义第110页/共129页5、最大似然法的估计方法为了取得的最大似然估计,必须使似然函数L达到最大值,并且把此时的作为的估计量。由于对数函数是单增的,L达到最大亦即LnL达到最大。这样使LnL达到最大来估计为计算带来了许多方便。根据微分中的拉格朗日定理,对未知参数求条件极值,令Ln
37、L对 的一阶导数等于0,即dLnL/d=0=得到似然方程,我们所求的就是似然方程中的解。第111页/共129页5、最大似然法示例之一第112页/共129页5、最大似然法示例之二例4 某电子管的寿命服从例3中的分布(实际上多为指数分布)抽取一组样本,其具体数值如下:根据例3的结果,在最大似然法下,指数分布中的,应用样本平均数估计。=(16+29+800+110)=318(小时)第113页/共129页5、最大似然法示例之三已知 N(,2),以一组样本观察值估计 的参数第114页/共129页(3)最小二乘法(Least Square Estimation Method)最小二乘法是计量经济学中应用最
38、广泛的一种估计方法。这是本课研究的重点问题,在以后各章中将详尽地阐述它的原理、步骤、特性和优越处。这里暂时不加以讨论。第115页/共129页二、区间估计(一)对总体期望值的估计1、已知方差,对数学期望E进行区间估计(1)方差已知,估计总体数学期望(2)正态总体(3)一般总体大样本下数学期望的区间估计2、方差未知,对对数学期望E进行区间估计(二)对总体方差的估计(三)关于区间估计的几点说明第116页/共129页区间估计的概念所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。用点估计估计参数,即使是无偏有效的估计量,也会由于样本的随机性,使得由样本计算出的估计值并不恰恰是真值。而且
39、即使等于真值,由于真值未知,我们也不能肯定这种相等。那么,究竟相差多少?于是问题等价为:在给定可靠程度下,指出被估计参数所在的可能值的范围,就是参数的区间估计问题。具体作法是找出两个统计量1(x1,xn)与2(x1,xn),使 P(2 2)=1-(1,2)称为置信区间,1-称为置信系数(置信度),称为冒险率(测不准的概率),一般等于5%或1%。第117页/共129页对区间估计的形象比喻我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计问题。(某甲的成绩为被估计的参数)P(2 2)=大概的准确程度(1-)如:P(75 =30时,就可以把样本平均数近似地看作服从正态分布N(,2/n)。所以,对于大样本仍可以按正态总体进行均值的区间估计。第125页/共129页2、方差未知,对对数学期望E 进行区间估计(1)大样本下根据中心极限定理,V 可以用s2代替,所以仍按已知方差正态分布的方法进行的置信区间估计。(2)小样本下第126页/共129页例8 新生儿体重的置信区间假设新生儿(男)的体重服从正态分布。随机抽取12名新生儿,测得体重如下表,试以95%的置信度估计新生儿(男)的平均体重。第127页/共129页对总体方差的区间估计第128页/共129页感谢您的观看!第129页/共129页