《8统计分布与参数估计.pdf》由会员分享,可在线阅读,更多相关《8统计分布与参数估计.pdf(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、8.1 总体、样本与统计量8.1 总体、样本与统计量总体总体是指研究对象的全体所组成的集合。是指研究对象的全体所组成的集合。个体个体是指组成总体的每个对象即元素。关心的是总体的的一项或几项数量指标是指组成总体的每个对象即元素。关心的是总体的的一项或几项数量指标 X。例如,我们考察电子元件的寿命时,则寿命例如,我们考察电子元件的寿命时,则寿命 X 为其一个数量指标,且为其一个数量指标,且 X 是服从指数分布的随机变量。是服从指数分布的随机变量。三、样本三、样本为了研究总体的性质,乍看起来,最好是把每个个体都加以观测研究,但这往往是不必要的,有时甚至是不可能的。例如,研究一批炮弹的杀伤力时,不可能
2、将每一发炮弹都拿来作试验。为了研究总体的性质,乍看起来,最好是把每个个体都加以观测研究,但这往往是不必要的,有时甚至是不可能的。例如,研究一批炮弹的杀伤力时,不可能将每一发炮弹都拿来作试验。一般,我们是从总体中抽取一部分,比如说一般,我们是从总体中抽取一部分,比如说 n个,进行观测,再根据这个,进行观测,再根据这 n 个观测值去推断总体的性质。个观测值去推断总体的性质。样本样本是按照一定的规则是按照一定的规则从总体中抽取的一部分个体从总体中抽取的一部分个体抽样抽样就是抽取样本的过程就是抽取样本的过程样本容量样本容量是样本中个体的数目是样本中个体的数目 n从民意测验看抽样从民意测验看抽样为了使样
3、本具有代表性,抽样必须是随机的。为了使样本具有代表性,抽样必须是随机的。我们称与总体同分布我们称与总体同分布且相互独立且相互独立的样本为的样本为简单随机样本简单随机样本,简称,简称样本样本 样本是一组随机变量样本是一组随机变量,记为,记为 X1,X2,Xn其具体数值记为其具体数值记为x1,x2,xn,称为,称为样本观测值样本观测值,简称,简称样本值样本值若总体若总体 X 的分布函数为的分布函数为 F(x),X1,X2,Xn为来自为来自F(x)的一个样本,则对的一个样本,则对 n 维随机变量维随机变量(X1,X2,Xn):=),.,(21*nxxxF=),.,(21*nxxxf=niixF1)(
4、=niixf1)(四、统计量四、统计量统计量统计量是完全由样本决定,不包含未知参数的函数是完全由样本决定,不包含未知参数的函数g(X1,X2,Xn)。统计量的判断统计量的判断对于相应的样本值对于相应的样本值(x1,x2,xn),g(x1,x2,xn)称为统计量的值,简称称为统计量的值,简称统计值统计值。常见统计量:常见统计量:样本均值样本均值:样本方差样本方差:样本样本 k 阶原点矩阶原点矩:样本样本 k 阶中心矩阶中心矩:统称:统称样本矩样本矩。=niiXnX11=niiXxnS122)(11=nikikXnA11=nikikXxnM1)(1几个重要关系式:几个重要关系式:XA=121221
5、22211AAXXnSnnMnii=统计量统计量统计值统计值X,S2,Ak,Mkx,s2,ak,mk8.2 常用的统计分布8.2 常用的统计分布一、四个常用分布1.标准正态分布一、四个常用分布1.标准正态分布上侧分位数上侧分位数U(0 =+udxxfuXP)(=1)(u=)(11uuXPuXPQ975.0025.01)(025.0=u96.1025.0=u2.自由度为2.自由度为n n的的 2 2(卡方)分布(卡方)分布定理定理6.2.1 设设 X1,X2,Xn相互独立相互独立且都服从标准且都服从标准正态分布正态分布,则即,则即随机变量随机变量 2服从服从自由度为自由度为 n 的卡方分布。的卡
6、方分布。)(2122nXnii=)(22n 2(n)的上侧分位数的上侧分位数(0 4545)时,有)时,有)(2n =+)(2222)()(ndxxfnP=+=+1)(2)(2UUnUnn满足其中,满足其中,3.自由度为自由度为 n 的的 t 分布分布Tt(n)(又称学生氏分布学生氏分布-第一个研究者以Student作笔名发表文章)定理定理6.2.2 设 随机变量设 随机变量X,Y 相互独立相互独立,X N(0,1),Y 2(n),则即,则即随机变量随机变量 T服从服从自由度为自由度为 n 的的 t 分布。分布。t(n)的上侧分位数的上侧分位数 t (n)(0 =+)()()(ntTdxxfn
7、tTPT 分布的特点:关于纵轴对称分布的特点:关于纵轴对称)()(1ntnt=unt)(n 较大时较大时(n30),4.F 分布分布FF(n1,n2)定理定理6.2.3 设 随机变量设 随机变量X,Y 相互独立相互独立,X 2(n1),Y 2(n2),则即,则即随机变量随机变量 F服从第一自由度为服从第一自由度为n1,第二自由度,第二自由度n2为的为的F分布。分布。推论推论),(2121nnFnYnXF=),(1),(1221nnFFnnFF若若F(n1,n2)的上侧分位数的上侧分位数F(n1,n2)(0 =+),(2121)(),(nnFFdxxfnnFFP),(1),(),(1221121
8、nnFnnFnnFF=若若二、抽样分布定理二、抽样分布定理定理定理6.2.4方差,则分别是样本均值和样本的样本是正态总体设方差,则分别是样本均值和样本的样本是正态总体设2221,),(,.,SXNXXXXn)1()4()1(1)3(),()2()1(22222ntnSXnSnnNXSX相互独立与相互独立与定理定理6.2.5本方差,则为各自的样本均值和样及且相互独立,的样本和分别是来自正态总体和设本方差,则为各自的样本均值和样及且相互独立,的样本和分别是来自正态总体和设2222212211212121,),(),(,.,.,SYSXNYNXYYYXXXnn2)1()1()(11)()()2()1
9、,1()1(2122221121212122212122222121+=+=+=+=nnSnSnSnntnnSYXTnnFSSFww其中,时,当其中,时,当参 数 估 计参 数 估 计 参数估计参数估计是对已知分布类型的总体是对已知分布类型的总体,利用样本,利用样本对其未知参数作出估计。对其未知参数作出估计。参数估计可作如下划分:参数估计可作如下划分:参数估计参数估计点估计点估计区间估计区间估计矩法估计矩法估计极大似然估计极大似然估计8.3 参数的点估计8.3 参数的点估计参数的点估计是针对已知分布类型的总体参数的点估计是针对已知分布类型的总体X,如果如果 1 1,2 2,m是分布函数中的未知
10、参数,是分布函数中的未知参数,X1,X2,Xn是总体是总体 X 的一组样本。的一组样本。对于每一个未知参数对于每一个未知参数 k(k=1,2,m),构造一个适当的统计量构造一个适当的统计量),.,(21nkkXXX=作为对参数作为对参数 k(k=1,2,m)的估计的估计,我们称之为参数我们称之为参数 k的估计量。的估计量。思想:用统计量去估计真实值。思想:用统计量去估计真实值。即用即用Ak来估计来估计 k,用,用Mk来估计来估计 k,从而得到一组关于未知参数的方程,一、矩估计法基本可思想为:用样本矩作为相应总体矩的估计,从而得到一组关于未知参数的方程,一、矩估计法基本可思想为:用样本矩作为相应
11、总体矩的估计(有多少未知参数就取多少这样的方程)解出未知参数即可得它的估计量。(有多少未知参数就取多少这样的方程)解出未知参数即可得它的估计量。+=dxxfXExdxxfxnknknknk),.,;()(),.,(),.,;(),.,(21212121=nkiknknikiknkXXnMXnA21121)(1),.,(1),.,(=i 1这样确定的估计量称为矩估计量,其对应的估计值称为矩估计值,统称为矩估计。这样确定的估计量称为矩估计量,其对应的估计值称为矩估计值,统称为矩估计。定义定义定义定义:若总体:若总体 X 的概率密度函数为的概率密度函数为f(x,)(可能为向量可能为向量),X1,X2
12、,Xn为来自为来自f(x,)的一个样本,则对的一个样本,则对 n 维随机变量维随机变量(X1,X2,Xn)的联合概率密度函数记为:称之为参数的联合概率密度函数记为:称之为参数 的的似然函数似然函数。=niinxfxxxL121);();,.,(对于离散型样本,其似然函数为其联合分布律对于离散型样本,其似然函数为其联合分布律)极大似然估计法基本思想就是按照最大可能性的准则进行推断。极大似然估计法基本思想就是按照最大可能性的准则进行推断。二、极大似然估计法二、极大似然估计法极大似然估计法极大似然估计法就是求参数就是求参数 的估计值,使似然函数(即联合概率密度函数或联合分布律)得到极大值。的估计值,
13、使似然函数(即联合概率密度函数或联合分布律)得到极大值。定义定义定义定义:若则称为:若则称为 的的极大似然估计值极大似然估计值。相应的估计量称为参数。相应的估计量称为参数 的的极大似然估计量极大似然估计量。);,.,(max);,.,(2121 nnxxxLxxxL=),.,(21nXXX=怎样求极大似然估计呢?因为怎样求极大似然估计呢?因为lnx是是x 的严格单增函数,的严格单增函数,lnL与与L有相同的极大值,故有相同的极大值,故一般一般只需求只需求lnL的极大值即可的极大值即可-令其一阶偏导为令其一阶偏导为0,得到似然方程(组),求解即可。,得到似然方程(组),求解即可。求极大似然估计的
14、求极大似然估计的一般步骤一般步骤:1.写出似然函数:写出似然函数:=niminxpxxxL12121),.,;();,.,(=nimixpL121),.,;(lnln),.,2,1(0lnmjLj=m,.,14.解似然函数方程组得即为所求。解似然函数方程组得即为所求。2.对似然函数取对数:对似然函数取对数:3.对对 j (j=1,m)分别求偏导,并令其为分别求偏导,并令其为 0 得似然方程得似然方程(组组):估计量的优良性准则估计量的优良性准则对于总体的一个参数,我们可用各种不同的方法去估计它,因此一个参数的估计量不唯一。对于总体的一个参数,我们可用各种不同的方法去估计它,因此一个参数的估计量
15、不唯一。在众多的估计量中,选哪一个更好?选取的标准是什么?在众多的估计量中,选哪一个更好?选取的标准是什么?下面给出三个常用的准则。下面给出三个常用的准则。当当 XU(0,),的矩法估计量为,而极大似然估计量为。的矩法估计量为,而极大似然估计量为。X2max1iniX 2.2.有效性有效性有效性有效性定义定义定义:设和是未知参数定义:设和是未知参数的两个的两个无偏无偏估计量,若对估计量,若对的所有可能取值都有,则称。设是的所有可能取值都有,则称。设是的无偏估计,如果对的无偏估计,如果对的任何一个无偏估计量都有则称为的任何一个无偏估计量都有则称为的的最小方差无偏估计量最小方差无偏估计量。),.,
16、(211nXXX 有效比有效比21)()(21DD),.,(212nXXX)()(0DD 0 0 定义:设是未知参数定义:设是未知参数的估计量,若,则称为的估计量,若,则称为的的无偏估计无偏估计无偏估计。无偏估计。),.,(21nXXX =)(E1.1.无偏性无偏性无偏性估计量的优良性准则无偏性估计量的优良性准则和和S2 是是和和2 的最小方差无偏相合估计。的最小方差无偏相合估计。X3.3.相合性相合性相合性相合性定义:设是未知参数定义:设是未知参数的估计量,若对任意的的估计量,若对任意的0,有则称为,有则称为的的相合估计量相合估计量相合估计量。相合估计量。),.,(21nXXX 1lim=P
17、n8.4 区间估计8.4 区间估计点估计的缺陷:点估计的缺陷:1)由于样本是随机的,估计值可能非真值由于样本是随机的,估计值可能非真值-即便估计量是无偏有效估计量。即便估计量是无偏有效估计量。2)即使估计值等于真实值,也无从肯定;不知相差多少。即使估计值等于真实值,也无从肯定;不知相差多少。改进:改进:对于对于的估计,给定一个范围:,并满足的估计,给定一个范围:,并满足:21,)应尽可能大应尽可能大21)1()P应尽可能小应尽可能小12)2()我们希望两者都能满足,但这二者是矛盾的!无法同时满足。我们希望两者都能满足,但这二者是矛盾的!无法同时满足。定义定义定义设总体的未知参数为定义设总体的未知参数为,由样本,由样本X1,Xn确定两个统计量和,对于给定的实数确定两个统计量和,对于给定的实数(0 1),满足,满足),.,(111nXX于是可以将上述两个要求改为:于是可以将上述两个要求改为:1)在一定可靠程度下在一定可靠程度下2)指出被估参数的可能取值范围指出被估参数的可能取值范围)=),.,(111nXX)=1),.,(),.,(1211nnXXXXP)则称随机区间为则称随机区间为的的置信度置信度为为1-的的置信区间置信区间。21,)1-又称又称置信系数置信系数或或置信概率置信概率又称又称置信水平置信水平,通常取值为,通常取值为0.1,0.05。