05抽样与抽样分布.pptx

上传人:s****8 文档编号:68606843 上传时间:2022-12-29 格式:PPTX 页数:94 大小:596.76KB
返回 下载 相关 举报
05抽样与抽样分布.pptx_第1页
第1页 / 共94页
05抽样与抽样分布.pptx_第2页
第2页 / 共94页
点击查看更多>>
资源描述

《05抽样与抽样分布.pptx》由会员分享,可在线阅读,更多相关《05抽样与抽样分布.pptx(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Ch5 抽样与抽样分布统计学原理统计学原理n5.1 随机抽样(new)n5.2 随机变量的分布(new)n5.3 抽样分布(new)n5.4 抽样方法与抽样误差(new)主要介绍:随机抽样,随机变量的分布,抽样分布,抽样方法与抽样误差。Ch5 主要内容Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法与抽样误差抽样方法与抽样误差(new)Ch5 学习目的学习目的1,掌握随机抽样及其性质2,掌握抽样方法与抽样误差的关系Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(n

2、ew)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法与抽样误差抽样方法与抽样误差(new)Ch5 抽样与抽样分布统计学原理统计学原理5.1 随机抽样(new)5.2 随机变量的分布(new)5.3 抽样分布(new)5.4 抽样方法与抽样误差(new)5.1 随机抽样随机抽样5.1.1 现象的随机化5.1.2 样本空间、事件、概率、分布函数5.1.3 随机抽样5.1.4 样本统计量Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法

3、与抽样误差抽样方法与抽样误差(new)返回在前面的几章里,我们用统计整理和统计描述的方法,研究了现象总体的数量特征和数量关系,比如计算总体平均数、总体的标准差、总体的方差和总体的分布,通过对这些指标的计算,我们得到了研究现象的规律性认识。我们亦可以用同样的方法,去研究样本的平均数、样本的标准差、样本的方差和样本分布,并且还可以利用样本的平均数、样本的标准差、样本的方差和样本分布,去反推总体的数量特征和数量关系,从而得到现象总体规律性的认识。用样本的资料去估计总体的方法,就是抽样估计。5.1.1 现象的随机化现象的随机化Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)探索客

4、观规律的过程5.1.1 现象的随机化现象的随机化Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)随机理论总体内在的数量规律性,F(x;)统 计 整 理和 统 计 描述总体数据样本数据图图51 探索客观规律的统计过程探索客观规律的统计过程抽样估计和统计推断反 映 客 观现 象 的 统计数据样本数据抽样估计是一种比较经济的估计方法。它的特点是利用随机抽样的理论,用比较少的数据及比较小的误差去达到处理大量数据的目标,从而得到现象总体规律性的认识。它是一种数据处理的优化方法为保证抽样理论的完整性和科学性,从这一节开始,我们将对所研究的现象进行随机化处理,即用概率的理论去研究现象的

5、规律性。5.1.1 现象的随机化现象的随机化Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.1.1 现象的随机化现象的随机化抽样估计的过程Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)图图51 探索客观规律的统计过程探索客观规律的统计过程可靠性总体分布函数F(x;)样本数据X样本统计量样本分布函数F(X;)随机样本可靠性总体参数样本参数抽样分布F()E(X)=E(x)=D(x)=2D(X)=S2D()E()=|数据变量的规律。样本数据样本变量的规律F(X;)。总体数据总体变量的规律F(x;)。样本统计量数据样本统计量的规律F(X)。样本分布函数

6、及样本统计量(样本参数)的计算方法。总体分布函数及总体参数的计算方法。样本统计量分布函数及样本统计量参数的计算方法。表5-1是现象随机化一揽表。5.1.1 现象的随机化现象的随机化Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.1.1 现象的随机化现象的随机化数理统计概率统计数学表示客观现象试验抽样试验试验的结果、样本组成单位、个体基本事件、样本点、元素 i;i=1,2,3,N。样本的所有可能结果、样本空间S、总体基本事件全集S=i;i=1,2,3,N。频率、事件A在S中出现的频率、fn(A)=n/N概率、事件A在S中出现的可能性、Pro(A|S)=ProA()|S数

7、据X变量XX事件A量化为数据X、样本数据X(A)随机变量X(A)X(A)A=i;i=1,2,3,n。nN事件S量化为数据X、总体数据X(S)随机变量X(S)X(S)S=i;i=1,2,3,N。基本事件i量化为数据Xi i Xi()如果i=1,2,3,n。则Xi()表示样本数据,X=Xi();i=1,2,3,.,n;如果i=1,2,3,.,N。则Xi()表示总体数据,x=Xi();i=1,2,3,.,N。X,x R统计分布概率分布总体F(x;);样本 F(X;)特征指标分布参数总体特征指标总体分布参数样本特征指标样本统计量、分布参数变量(X)Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随

8、机抽样(new)表表5-1 现象随机化一揽表现象随机化一揽表返回5.1.2 样本空间、事件、样本空间、事件、概率、分布函数概率、分布函数Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n随机现象随机现象n在个别试验中其结果呈现不确定性;在大量的重复试验中其结果又具有规律性的现象,我们称为随机现象。比如我们感兴趣的现象总体,如果具有上述特征,那么这个现象总体就是一个随机现象。通常,我们所研究的总体都是随机现象。随机现象总体表现记为X。n随机事件随机事件(试验试验)n在某种随机现象里,在一定条件下,可能发生也可能不发生的事件,就是随机事件。比如,在总体中的某个样本,在一定条件

9、下,可能被抽取出来,也可能没有抽取出来,那么这个样本是否能够出现,就是一个随机事件。随机事件一个偶然事件,通常用表示。反之,在同样条件下不可能出现的事件,叫不可能事件;不可能事件用V表示。在同样条件下一定出现的事件,叫必然事件;必然事件用U表示。在概率统计里,U和V本身也是一个随机事件。VU。5.1.2 样本空间、事件、样本空间、事件、概率、分布函数概率、分布函数Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n样本空间样本空间n随机事件的所有可能结果所组成的集合,称为样本空间。样本空间记为S,S=或S=X()或者S=Xi;i=1,2,3,.,N。样本空间的每个结果,称为

10、样本点。对于样本空间S,满足给定性质的样本点集合A,就是事件A。事件A是样本空间的一个样本。样本A由若干个样本点组成。显然,样本空间S是一个必然事件,S=U;空集是一个不可能事件,=V。于是,也有S。当然,AS。样本空间,随机事件的变化范围是。n随机变量随机变量n在抽样过程中,每次抽取出来的样本结果都是不可预知的。因此,常常把样本叫做随机样本;这个样本的特征表现,就叫一个随机变量。比如我们抽取的样本数据,其数据结果就是一个随机变量。随机变量是随机事件数量化的结果,常常用X()表示。如果建立事件与数量序数i的对应关系,则随机变量又可用Xi表示。在大多数情况下,随机事件和随机变量是等同使用的。5.

11、1.2 样本空间、事件、样本空间、事件、概率、分布函数概率、分布函数Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n概率概率n在相同条件S下随机实验N次,事件出现n次,nN,于是比值n/N就称为事件发生的频率,并且随着N的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,则这个稳定的频率值就是概率。记为(5.1.1)因此,概率是指随机事件发生的可能性大小。它是定义在样本空间所有的集合上的实值函数。是对事件频率可能观察到的规律性所做的数学概括。n因为n N,所以0Pro|S 1,(5.1.2)对不可能事件V和必然事件U,由于S,有Pro=V=|S=0,P

12、ro=U=S|S=1。(5.1.3)由于X(),则随机事件的概率表示一般又为Pro|S=ProX()|S=Pro X=Xi|S;i=1,2,3,.,N (5.1.4).其中,最常见的表示为Pro X=Xi|S;i=1,2,3,.,N.(5.1.5)5.1.2 样本空间、事件、样本空间、事件、概率、分布函数概率、分布函数Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n概率分布函数随机变量X的所有可能结果,与其相应的概率ProX()|S 排列,就是X的概率分布。如Pro X=xi|S;i=1,2,3,.,N.(5.1.6)定义:由X所决定的概率函数ProX()|S 为一个分

13、布函数,记为 F(x)=ProX x.(5.1.7)其中:x表示Xi中的任何一个值,它既表示X的所有可能变化范围,又表示样本观察值的全集;X x表示一个X在一个相对固定的数量集x上的变化;而F(x)则表示X的概率在某个范围X x上的连续累积,它反映了X在某个值域上的概率变化规律,是对随机变量X统计规律性的完整描述。5.1.2 样本空间、事件、样本空间、事件、概率、分布函数概率、分布函数Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n概率分布函数(续)当Xi是分离的值时,F(x)是离散分布函数,离散分布函数表示为(5.1.8)如果Xi是连续的变量,F(x)则是连续分布函数

14、,F(x)为(5.1.9)其中,f(X)是连续分布函数的概率密度函数。对于一个具体的分布函数F(x),决定F(x)值的因素,除了随机变量X外,还有分布的参数,是决定分布形状的重要指标,因此,分布函数常常又表示为F(x;)。比如(5.1.10)返回5.1.3 随机抽样随机抽样Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)n所谓抽样,就是从总体中按一定的抽样技术抽取若干个体,所抽取的若干个体称为一个样本;样本的抽取过程就称为抽样。样本中所含个体的数量称为样本容量。样本中每个个体的值就叫样本观察值。其一般数量表示是:设X1,X2,X3,Xn是从总体X得到的一个容量为n的简单样

15、本;如果X是具有分布函数F的随机变量,则样本X1,X2,X3,Xn就是一个具有同一分布F的、相互独立的随机变量,随机变量组X1,X2,X3,Xn就为从总体X得到的容量为n的简单随机样本;样本的观察值x1,x2,x3,xn称为样本值,又称为X的n个独立的观察值。抽样(续)因此,若X1,X2,X3,Xn为F的一个样本,则X1,X2,X3,Xn的联合分布函数为(5.1.11)如果X具有概率密度f,则X1,X2,X3,Xn的联合概率密度函数为(5.1.12)这个结论,从分布的特征表示角度理解,就是样本与总体应该具有相似性与独立性。抽样的目的是为了推断总体的某些重要特征,即利用样本推测总体分布特征和分布

16、函数。具体地说,就是求F(x;)和。5.1.3 随机抽样随机抽样Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)返回样本统计量样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的函数,利用这些样本函数进行统计推断。这些与样本有关的函数,就是样本统计量。样本统计量定义为:设X1,X2,X3,Xn是来自总体X的一个样本,Z(X1,X2,X3,Xn)是X1,X2,X3,Xn的函数,若Z是连续函数且Z中不含任何未知参数,则称Z(X1,X2,X3,Xn)是一样本统计量,简称统计量。样本统计量统一简记为Zn=Z(X1,X2,X3,Xn)。下面列出

17、的是几个常用的统计量。5.1.4 样本统计量样本统计量Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)样本平均值(5.1.13)样本方差(5.1.14)样本标准差(5.1.15)样本k阶原点矩(5.1.16)样本k阶中心矩(5.1.17)5.1.4 样本统计量样本统计量Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)样本统计量(续)它们的观察值分别为(5.1.18)5.1.4 样本统计量样本统计量Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)样本统计量(续)如果样本是一个随机样本,X1,X2,X3,Xn1是一个随机变量,则样本

18、统计量也将变成一个随机变量。样本统计量Zn=Z(X1,X2,X3,Xn)是随机变量X的函数。由于样本统计量是反映总体特征参数的函数,它与抽样有关,因此样本统计量分布又叫抽样分布。可以证明,在抽样条件下,可以用样本的统计均值去估计总体的期望值E(X)=1,用样本的统计方差S2去估计总体的方差2,等等。1,2是总体参数的一部分。5.1.4 样本统计量样本统计量Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)返回5.2 随机变量的分随机变量的分布布5.2.1 随机变量的分布5.2.2 分布的数量特征5.2.3 二项分布5.2.4 正态分布5.2.5 大数定律与中心极限定理Ch5

19、 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法与抽样误差抽样方法与抽样误差(new)返回5.2.1 随机变量的分布随机变量的分布Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)n统计估计的核心问题是求F(x;)和。n求F(x;)和就必须掌握X的分布和的分布。的分布又叫参数分布。n这里先了解基本随机变量X的分布。抽样分布将在下一节讨论。F(x;)F(X;)F(X;)=(X)F(X)F()随机变量的分布随机变量函数的分布、参数分布、抽样分布。n,N比较

20、小时,可列出。F()n,N比较大时,可求出精确分布或者极限分布。5.2.1 随机变量的分布随机变量的分布Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)n设X是一个随机变量,x是一个任意实数,则由(5.1.7)所定义的函数 F(x)=ProX x.(5.2.1)就为X的分布函数。对于任意的实数x1,x2,我们有Prox1X x2=ProX x2-ProX x1(5.2.2)=F(x2)-F(x1).因此,只要知道X的分布函数,就可知道落在任一区间(x1,x2)上的概率。如果将X看成是数轴上随机点的坐标,那么,F(x)在x处的函数值就表示X落在区间(-,x)上的

21、概率。5.2.1 随机变量的分布随机变量的分布Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)n显然,对于离散型随机变量,有(5.2.3)对于连续型随机变量,有(5.2.4)其中,f(X)是连续分布函数的概率密度函数。并且由(5.1.10)有最典型的分布,离散型为二项分布,连续型为正态分布。返回5.2.2 分布的数量特征分布的数量特征分布的数量特征就是指分布F(x;)的参数。分布参数是决定分布形状及分布特征的重要指标。常用的参数指标有:数学期望,方差,。数学期望设离散型随机变量X的分布律为Pro X=Xi=Pi;i=1,2,3,.(5.2.5)如果级数绝对收敛

22、,则称级数的和为离散型随机变量X的数学期望,记为E(X),即(5.2.6)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.2 分布的数量特征分布的数量特征数学期望(续)设连续型随机变量X的概率密度为f(x),若积分绝对收敛,则称积分的值为连续型随机变量X的数学期望,记为E(X),即(5.2.7)数学期望简称为期望,又称为均值。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.2 分布的数量特征分布的数量特征方差设X是一随机变量,如果EX-E(X)2存在,则称EX-E(X)2为X的方差,记为D(X)或者Var(X)

23、,即 D(X)=Var(X)=EX-E(X)2.(5.2.8)D(X)刻画了X的取值与其数学期望的偏离程度。如果X取值比较集中,则D(X)较小,反之,则D(X)比较大。因此,D(X)是衡量X取值分散程度的一个尺度。有 D(X)=E(X2)-E(X)2.(5.2.9)对D(X)开平方根,记为(X),(5.2.10)(X)称为标准差或均方差。(X)是与随机变量具有相同量纲的量。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.2 分布的数量特征分布的数量特征Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)n协方差与相关系数如

24、果X,Y不是相互独立,而是存在一定的关系,EX-E(X)Y-E(Y)0.,则称EX-E(X)Y-E(Y)为的X与Y的协方差。记为Cov(X,Y),即Cov(X,Y)=EX-E(X)Y-E(Y).(5.2.11)而(5.2.12)称为随机变量X与Y的相关系数。XY也是一个无量纲的量。可以证明 Cov(X,Y)=E(X Y)-E(X)E(Y).(5.2.13)0|XY|1.(5.2.14)XY是一个表征X与Y之间线性相关程度的量。当|XY|较大时,X,Y线性相关程度较好;当|XY|较小时,X,Y线性相关程度较差;当|XY|=0时,X,Y线性不相关;当|XY|=1时,X,Y之间以概率1存在线性相关关

25、系。5.2.2 分布的数量特征分布的数量特征矩设X与Y是随机变量,如果 E(Xk);k=1,2,.(5.2.15)存在,称它为X的k阶原点矩,简称为k阶矩。若 EX-E(X)k;k=1,2,.(5.2.16)存在,称它为X的k阶中心矩。如果 E(XkYl);k,l=1,2,.(5.2.17)存在,称它为X和Y的k+l阶混合矩。若 EX-E(X)kEY-E(Y)l;k,l=1,2,.(5.2.18)存在,称它为X和Y的k+l阶混合中心矩。显然,E(X)是X的一阶原点矩,D(X)是X的二阶中心矩,Cov(X,Y)是X与Y的1+1阶混合中心矩。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分

26、布随机变量的分布(new)5.2.2 分布的数量特征分布的数量特征位置表征满足不等式ProX xp,ProX x1-p;(0p1)(5.2.19)的x值为p阶分位数,记为xp。如果随机变量X是连续型的,那么p阶分位数就是满足方程 F(x)=ProX x=p;(5.2.20)的x值。可能有几个x值满足不等式(5.2.19)或者方程(5.2.20)。这时每一个数值都称为p阶分位数。通常较小的称为p阶下分位数,较大的称为p阶上分位数。例如,p=1/2,x1/2称为1/2分位数;p=1/4,x1/4称为1/4分位数。分位数及它的函数通称为位置表征。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的

27、分布随机变量的分布(new)返回5.2.3 二项分布二项分布设有n次试验,各次试验是彼此独立的,每次实验事件A出现的概率都是P,事件A不出现记为,它的概率都是q=1-P,这种重复试验叫做重复实验。在n次重复试验中,如果事件A出现X=0,1,2,n次的概率,依次为二项展开式(P+q)n=Cn0Pn+C n1Pn-1q+C n2P n-2q2+.+C nn-1P1q n-1+C nnq n.的各相应项,即(5.2.21)则这个概率分布就叫二项分布。Bernoulli最先研究了这个分布,所以又叫Bernoulli分布。二项分布简单记为X b(x;n,P);b(x;n,P)=C nxPxq n-x。C

28、h5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.3 二项分布二项分布二项分布(续)二项分布的数值,取决于试验的次数n和每次事件A出现的概率P。如果n=1,则二项分布就是二点分布。二点分布是二项分布的特例,X只能是0,1记为X b(x;1,P)。二项分布的分布函数为(5.2.22)其期望值和方差为 E(X)=nP;D(X)=nPq;(5.2.23)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.3 二项分布二项分布二项分布(续)特别地,当P很小,n为极大,nP恒定保持为一个常数,nP=时,有(5.2.24)但当n为

29、极大,P不是很小,则为(5.2.25)它表示,如果X表示在n次独立试验中成功的次数,P为每单一试验成功的概率,则当试验次数无限增大时,在P很小或者不是很小时,变量X的分布分别趋近于两种不同的分布:前者为泊松分布;后者则是正态分布。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.3 二项分布二项分布二项分布(续)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)图图52 二项分布密度与分布函数二项分布密度与分布函数P(x)xx二项分布函数二项分布密度F(x)n=10,P=0.50123456789100.20.30.2n=

30、10,P=0.5000.10.61012345678910返回5.2.4 正态分布正态分布如果随机变量X是一个连续变量,且X的概率密度为(5.2.26)则称X服从正态分布N(,2);简记为XN(,2)。可以证明:E(X)=;D(X)=2;Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)图图53 正态分布密度与分布函数正态分布密度与分布函数f(X)X0 x0正态分布函数正态分布密度F(x)=0.5=2=110.55.2.4 正态分布正态分布正态分布N(,2)f(X)的图形呈对称钟形,对称轴为X=;f(X)的最大值在X=,在X=有拐点;当X时,曲线以X轴为渐近线。

31、当大时,曲线平缓;当小时,曲线陡峭。如果=0,2=1,则N(0,1)就称为标准正态分布。它的概率密度为(5.2.27)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.4 正态分布正态分布正态分布(续)如果XN(,2),则X的分布函数可表示为(5.2.28)因为只要令Z=(X-)/,z=(x-)/,就有(5.2.29)则证明,如果XN(,2),则随机变量Z=(X-)/N(0,1)。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.4 正态分布正态分布正态分布(续)进一步,令(5.2.30)容易得,(-x)=1(x)

32、。已经编制了(x)的函数表在附表,供查用。于是正态分布函数可表示为Pro(X x)=(x)。可以证明,正态分布N(,2)的E(X)=,D(X)=2。显然,当n为极大,P不是很小,如果二项分布的极限分布是正态分布,则其平均数为nP、方差为nP(1-P)。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.4 正态分布正态分布正态分布(续)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)图图54 标准正态分布与上标准正态分布与上分位点分位点f(Z)Z0Z0正态分布上分位点标准正态分布1-Zf(z)返回5.2.5 大数定律与中心

33、极限定理大数定律与中心极限定理大数定律是反映算术平均数稳定性与频率稳定性的定律。它们由以下三组定理组成:定理一契比雪夫定理特例。定理二贝努利定理。定理三辛钦定理。是随机变量函数的分布的基础。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理定理一契比雪夫定理特例。设随机变量X1,X2,X3,Xn,相互独立,且具有相同的数学期望和方差,E(Xi)=,D(Xi)=2,i=1,2,.。作前n个随机变量的算术平均(5.2.31)则对于任意的正数有(5.2.32)或者表达为:设随机变量X1,X2,X3,Xn,相互独立

34、,且具有相同的数学期望和方差,E(Xi)=,D(Xi)=2,i=1,2,.。则序列Yn依概率收敛于。记为(5.2.33)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理定理二贝努利定理。设nA是n次独立重复试验中事件A发生的次数。P是事件A在每次试验中发生的概率,则对于任意的正数有(5.2.34)在抽样统计里,nA/n也叫抽样成分数,简称为成数。定理三辛钦定理。设随机变量X1,X2,X3,Xn,相互独立,服从相同的分布,且具有数学期望E(Xi)=,i=1,2,.。则对于任意的正数有(5.2.35)Ch5

35、抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理中心极限定理在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的。而其中每一个个别因素在总体中的影响作用都是很小的。这种随机变量往往近似地服从正态分布。它同样由3组定理组成:定理一独立同分布的中心极限定理。定理二Lapunov中心极限定理。定理三DeMoivreLaplace定理。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理定理一独立同分布的中心极

36、限定理。设随机变量X1,X2,X3,Xn,相互独立,服从相同的分布,且具有相同的数学期望和方差,E(Xi)=,D(Xi)=2,i=1,2,.。则随机变量(5.2.36)的分布函数Fn(x),对于任意的x满足(5.2.37)Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理定理二Lapunov中心极限定理。设随机变量X1,X2,X3,Xn,相互独立,它们有数学期望和方差,E(Xi)=i,D(Xi)=i2,i=1,2,.。记(5.2.38)如果存在正数,使得当n时,(5.2.39)则随机变量(5.2.40)的分

37、布函数Fn(x),对于任意的x满足(5.2.41)即不论X服从什么分布,只要n,随机变量Zn将近似地服从标准正态分布。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)5.2.5 大数定律与中心极限定理大数定律与中心极限定理定理三DeMoivreLaplace定理。设随机变量n服从参数为n,P的二项分布,则对于任意的x,恒有(5.2.42)这个定理表明,正态分布是二项分布的极限分布。即(5.2.43)在抽样统计里,n/n也叫抽样成数。Ch5 抽样与抽样分布抽样与抽样分布5.2 随机变量的分布随机变量的分布(new)返回n统计估计的核心问题是求F(x;)和。n求F

38、(x;)和就必须掌握X的分布和的分布。的分布又叫参数分布。n在上一节,我们了解了随机变量X的分布。在这里了解可列的抽样分布。n可列的抽样分布,就是样本的所有可能取值与相应的概率组成。F(x;)F(X;)F(X;)=(X)F(X)F()随机变量的分布随机变量函数的分布、参数分布、抽样分布。n,N比较小时,可列出。F()n,N比较大时,可求出精确分布或者极限分布。5.3 抽样分布抽样分布Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法与抽样误差抽样方法与抽样误差(new)n样本统计

39、量的分布,统称为抽样分布。n抽样分布,就是样本统计量Zn=Z(X1,X2,X3,Xn;)的分布。n样本统计量是样本的函数,它是一随机变量。在使用统计量进行统计推断时,常需知道它的分布。n对于任意一个给定统计量Zn=Z(X1,X2,X3,Xn;),其分布的确定,一般有两种情况:n第一种是,当总体的分布函数已知时,Zn的分布是可精确确定的,但这种情况极少,绝大多数只能求出它们的极限分布,即样本数目n时统计量Zn的渐近分布;n另一种是,总体的分布函数为未知时,只能求出的样本统计量的极限分布。支持统计量极限分布的理论依据,是概率函数序列中的极限定理。n下面我们顺序给出若干统计量的分布结论,并假定样本都

40、是简单随机样本,不涉及它们的证明。5.3 抽样分布抽样分布5.3 抽样分布抽样分布5.3.1 样本均值分布与中心极限定理5.3.2 样本成数的分布5.3.3 2分布与2阶原点矩的分布 5.3.4 t分布5.3.5 样本方差的分布与样本标准差的分布 5.3.6 F分布与两个样本方差比的分布5.3.7 样本相关系数的分布5.3.8 样本矩的极限分布Ch5 抽样与抽样分布抽样与抽样分布5.1 随机抽样随机抽样(new)5.2 随机变量的分布随机变量的分布(new)5.3 抽样分布抽样分布(new)5.4 抽样方法与抽样误差抽样方法与抽样误差(new)返回n样本平均数的分布(可列的)n总体中全部样本平

41、均数的可能取值与相应的概率排列。n重置抽样n不重置抽样n【例5-1】(p111)总体34,38,42,46,50,=42,2=32。重置抽取2个构成样本。求样本平均数的分布。n解:重置抽取2个构成样本,其样本总数为C51C51=25。其样本平均数的全部可能数据为Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)样本变量34384246503434363840423836384042444238404244464640424446485042444648505.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理n整理数据,可得样本平均数的分布。n同时得样本平均数的期

42、望值和样本平均数的方差,以及样本与总体的关系Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)样本平均数 频数fi频率3411/253622/253833/254044/254255/254444/254633/254822/255011/25合计251fi34 36 38 40 42 44 46 48 505.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理n【例5-2】(p115)总体34,38,42,46,50,=42,2=32。不重置抽取2个构成样本。求样本平均数的分布。n解:不重置抽取2个构成样本,其样本总数为A52=C51C41=20。其样本平均数的

43、全部可能数据为Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)样本变量343842465034-363840423836-404244423840-444646404244-485042444648-5.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理n整理数据,可得样本平均数的分布。n同时得样本平均数的期望值和样本平均数的方差,以及样本与总体的关系Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)样本平均数 频数fi频率3622/203822/204044/204244/204444/204622/204822/20合计201fi34 3

44、6 38 40 42 44 46 48 505.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理n当n,N比较小时,可得可列的样本平均数的分布。但如果n,N非常大时,其样本平均数的分布是怎样的呢?n一、精确分布:n如果X N(,2),X1,X2,X3,Xn是X的一个样本,则样本平均数n其中重置抽样n不重置抽样Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)5.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理n二、中心极限定理(极限分布):n如果X的均值为,方差为2,X1,X2,X3,Xn是X的一个样本,则不论X服从什么分布,只要X存在矩母函数,总有

45、n(5.3.3)n并且,当n30时,近似服从N(,2/n)。n因此,亦可有Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)5.3.1 样本均值分布与中心极限定理样本均值分布与中心极限定理返回5.3.2 样本成数的分布样本成数的分布Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)返回n从任一总体成数为P,方差为P(1-P)的(0,1)分布中,抽取样本容量为n的样本,其样本成数p的分布,当样本单位数n25时,其分布为二项分布;当n 25时,其分布趋近于平均数为E(p)=P,标准差为p的正态分布。即 pN(P,p2)其中,当抽样为简单重置抽样时,当抽样为简

46、单不重置抽样时,5.3.3 2分布与分布与2阶原点矩的分布阶原点矩的分布 2分布如果X1,X2,X3,Xn是来自总体N(0,1)的样本,则统计量2=X12+X22+X32+Xn2(5.3.4)服从自由度为n的2分布,记为22(n)。其中,自由度是指独立变量的个数。2分布的概率密度为(5.3.5)f(y=2)的图形如图5-5所示。Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)5.3.3 2分布与分布与2阶原点矩的分布阶原点矩的分布 2分布(续)2分布的期望值和方差为 E(2)=n;D(2)=2n;(5.3.6)Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(

47、new)图图55 2分布与上分布与上分位点分位点f(y)y0y0f(y)2分布n=11-2(n)n=5n=152分布上分位点5.3.3 2分布与分布与2阶原点矩的分布阶原点矩的分布 2分布(续)又由于,(5.3.7)于是,可知2分布也是一个特殊的分布。对于给定的正数,030)时,t分布近似于N(0,1)分布。但对于较小的,t分布与N(0,1)分布相差很大。t分布与无关,且只存在阶数kn-1的矩。例如,当n=2时,就根本没有矩。对于给定的正数,01,则满足条件(5.3.17)的点t(n)为t(n)分布的上分位点,如图5-6所示。由t(n)分布的上分位点定义及h(t)图形的对称性质知t1-(n)=

48、-t(n),t(n)分布的上分位点可查表求得。例如,对于=0.1,n=25,查得t(n)=1.3163。Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)返回5.3.5 样本方差的分样本方差的分布与样本标准差的分布布与样本标准差的分布 样本方差的分布如果X N(,2),X1,X2,X3,Xn是X的一个样本,则与样本方差有关的统计量(5.3.18)于是,样本方差的期望值和方差为 E(S2)=2;D(S2)=24/n;(5.3.19)样本标准差的分布如果X N(,2),X1,X2,X3,Xn是X的一个样本,则与样本标准差有关的统计量(5.3.20)Ch5 抽样与抽样分布抽样与抽

49、样分布5.3 抽样分布抽样分布(new)返回5.3.6 F分布与两个分布与两个样本方差比的分布样本方差比的分布 F分布设U 2(n1),V 2(n2),并且U,V相互独立,则称随机变量(5.3.21)服从自由度为(n1,n2)的F分布,记为F F(n1,n2)。F分布又称为R.A.Fisher分布。F(n1,n2)分布的概率密度为(5.3.22)(y=F)的图形如图5-7所示。由定义可知,如果F F(n1,n2),则1/F F(n2,n1)。Ch5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)5.3.6 F分布与两个分布与两个样本方差比的分布样本方差比的分布 F分布(续)Ch

50、5 抽样与抽样分布抽样与抽样分布5.3 抽样分布抽样分布(new)图图57 F分布与上分布与上 分位点分位点(y)y0y0(y)F分布n1=10,n2=25 1-F(n1,n2)F分布上 分位点n1=10,n2=5n1=10,n2=15.3.6 F分布与两个分布与两个样本方差比的分布样本方差比的分布 F分布(续)对于给定的正数,01,则满足条件(5.3.23)的点F(n1,n2)为F(n1,n2)分布的上分位点,如图5-7所示。F分布的上分位点有表可查。F分布的上分位点有如下性质:F 1-(n1,n2)=1/F (n2,n1).(5.3.24)可利用该性质求出F分布表上未列出的上分位。例如,F

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁