《概率论与数理统计-第六章 数理统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计-第六章 数理统计的基本概念.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计的基本概念数理统计的基本概念 第六章第六章一一个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.1.1.总体总体研究某批灯泡的质量研究某批灯泡的质量研究对象的全体称为研究对象的全体称为总体总体(母体母体),总体中每个成员称为总体中每个成员称为个体个体.总体总体一、总体和样本一、总体和样本第一讲第一讲 总体与样本总体与样本 总体总体有限总体有限总体无限总体无限总体然而在统计研究中,人们关心总体仅仅然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项是关心其每个个体的一项(或几项或几项)数量指标数量指标和该数量指标在总体中的分布情况和该数量指标在总体中的分布情况.这时,这时
2、,每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体.某批某批灯泡的寿命灯泡的寿命该批灯泡寿命的该批灯泡寿命的全体就是总体全体就是总体国产轿车每公里国产轿车每公里的耗油量的耗油量国产轿车每公里耗油国产轿车每公里耗油量的全体就是总体量的全体就是总体由于每个个体的出现是随机的,所以相由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性应的数量指标的出现也带有随机性.从而从而可以把这种数量指标看作一个随机变量,因可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中此随机变量的分布就是该数量指标在总体中的分布的分布.这样,这样,总体就可以用一个
3、随机变量总体就可以用一个随机变量及其分布来描述及其分布来描述.而而概率分布概率分布正是刻划这种集体性质正是刻划这种集体性质的适当工具的适当工具.因此在理论上可以把总体因此在理论上可以把总体与概率分布等同起来与概率分布等同起来.从另一方面看从另一方面看 统计的任务统计的任务,是根据从总体中抽取的是根据从总体中抽取的样本样本,去推断总体的性质去推断总体的性质.由于我们关心的是总体中的个体的某由于我们关心的是总体中的个体的某项指标项指标(如人的身高、体重,灯泡的寿命如人的身高、体重,灯泡的寿命,汽车的耗油量汽车的耗油量),所谓总体的性质所谓总体的性质,无无非就是这些指标值的集体的性质非就是这些指标值
4、的集体的性质.例如例如:研究某批灯泡的寿命时,关心的数研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随量指标就是寿命,那么,此总体就可以用随机变量机变量X表示,或用其分布函数表示,或用其分布函数F(x)表示表示.某批某批灯泡的寿命灯泡的寿命总体总体寿命寿命X可用一概可用一概率分布来刻划率分布来刻划鉴于此,常用随机变量的记号鉴于此,常用随机变量的记号或用其分布函数表示总体或用其分布函数表示总体.如如说总体说总体X或总体或总体F(x).F(x)只需用一个随机变量描述的总体称为一维总体只需用一个随机变量描述的总体称为一维总体类似地,在研究某地区中学生的营养状类似地,在研究某地区中
5、学生的营养状况时,若关心的数量指标是身高和体重,我况时,若关心的数量指标是身高和体重,我们用们用X和和Y分别表示身高和体重,那么此总体分别表示身高和体重,那么此总体就可用二维随机变量就可用二维随机变量(X,Y)或其联合分布函或其联合分布函数数F(x,y)来表示来表示.称为二维总体称为二维总体.统计中,总体这个概念统计中,总体这个概念的要旨是:的要旨是:总体就是一个总体就是一个概率分布或服从这个概率概率分布或服从这个概率分布的随机变量分布的随机变量.本书主要研究一维总体本书主要研究一维总体.为推断总体分布及各种特征,按一定规为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以
6、则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为获得有关总体的信息,这一抽取过程称为“抽样抽样”,所抽取的部分个体称为,所抽取的部分个体称为样本样本.样本中所包含的个体数目称为样本中所包含的个体数目称为样本容量样本容量.2.样本样本从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5但是,一旦取定一组样本,得到的是但是,一旦取定一组样本,得到的是n个具体的数个具体的数(x1,x2,xn),称为样本称为样本的一次观察值,简称的一次观察值,简称样本值样本值.样本是随机变量样本是随机变量.抽到哪抽到哪5辆是随机的辆是随机的容量为容量为n的样本
7、可以看作的样本可以看作n维随机变量维随机变量.样本值的集合称为总体样本值的集合称为总体X的容量为的容量为n的的样本空间样本空间。2.独立性独立性:X1,X2,Xn是相互独立的随是相互独立的随机变量机变量.由于抽样的目的是为了对总体进行由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法映总体的信息,必须考虑抽样方法.最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随简单随机抽样机抽样”,它要求抽取的样本满足下面,它要求抽取的样本满足下面两点两点:1.代表性代表性:X1,X2,Xn中每一个与所考察中每一个与所考
8、察的总体有相同的分布的总体有相同的分布.由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单简单随机样本随机样本,它可以用与总体独立同分布的,它可以用与总体独立同分布的n个相互独立的随机变量个相互独立的随机变量X1,X2,Xn表示表示.简单随机样本简单随机样本是应用中最常见的情是应用中最常见的情形,今后,当说到形,今后,当说到“X1,X2,Xn是取自某是取自某总体的样本总体的样本”时,若不特别说明,就指简时,若不特别说明,就指简单随机样本单随机样本.若总体的分布函数为若总体的分布函数为F(x),则其简单随机则其简单随机样本的联合分布函数为样本的联合分布函数为F(x1)F(x2)F(xn
9、)事实上我们抽样后得到的资料都是具事实上我们抽样后得到的资料都是具体的、确定的值体的、确定的值.如我们从某班大学生中如我们从某班大学生中抽取抽取10人测量身高,得到人测量身高,得到10个数,它们是个数,它们是样本取到的值而不是样本样本取到的值而不是样本.我们只能观察我们只能观察到随机变量取的值而见不到随机变量到随机变量取的值而见不到随机变量.3.总体、样本、样本值的关系总体、样本、样本值的关系总体(理论分布)总体(理论分布)?样本样本样本值样本值统计是从手中已有的资料统计是从手中已有的资料-样本值,去样本值,去推断总体的情况推断总体的情况-总体分布总体分布F(x)的性质的性质.总体分布决定了样
10、本取值的概率规律,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由也就是样本取到样本值的规律,因而可以由样本值去推断总体样本值去推断总体.样本是联系二者的桥梁样本是联系二者的桥梁一一.统计三大分布统计三大分布记为记为定定义义:设设相相互互独独立立,都都服服从从标标准准正态分布正态分布N(0,1),则称随机变量:则称随机变量:所服从的分布为自由度为所服从的分布为自由度为 n的的 分布分布.分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布.第三讲第三讲分布分布1、由由分布的定义,不难得到:分布的定义,不难得到:(1).设设相互独立相互独立,都服从正态分布
11、都服从正态分布则则(2).设设且且X1,X2相互相互独立,则独立,则这个性质叫这个性质叫分布的可加性分布的可加性.则则可以求得,可以求得,E(X)=n,D(X)=2n若若(3).证明:证明:设设相互独立且都服从相互独立且都服从N(0,1)分布,则)分布,则,故故X,Y同分布,得同分布,得下面给出下面给出分布的分布的上侧上侧分位数分位数(或临或临界值界值)的定义的定义.例如例如:设设01,对随机变量对随机变量X,称满足称满足的点的点为为X的概率分布的上侧的概率分布的上侧分位数分位数.分布的上分布的上分位数分位数自由度为自由度为n的的T的密度函数为:的密度函数为:记为记为Tt(n).定定义义:设设
12、XN(0,1),Y,且且X与与Y相相互独立,则称变量互独立,则称变量所服从的分布为自由度为所服从的分布为自由度为n的的t 分布分布.2、t 分布分布例如例如:设设01,对随机变量对随机变量T,称满足,称满足的点的点为为T分布的上侧分布的上侧分位数分位数.Tt(n).不难看到,当不难看到,当n充分大时,充分大时,t 分布近分布近似似N (0,1)分布分布.但对于较小的但对于较小的n,t分布分布与与N(0,1)分布相差很大分布相差很大.请看演示请看演示t分布分布由由定义可见,定义可见,3、F分布分布服从自由度为服从自由度为n1及及n2的的F分布,分布,n1称为第称为第一自由度,一自由度,n2称为第
13、二自由度,记作称为第二自由度,记作FF(n1,n2).定义定义:设设X与与Y相互相互独立,则称统计量独立,则称统计量F(n2,n1)设设01,对随机变量对随机变量F,称满足,称满足的点的点为为F分布的上侧分布的上侧分位数分位数.F分布的上分布的上分分位数位数自由度为自由度为n1,n2的的例如例如:统计三大分布的定义、基本性质在统计三大分布的定义、基本性质在后面的学习中经常用到,要牢记!后面的学习中经常用到,要牢记!教材给出了概率分布的上侧分位数(分教材给出了概率分布的上侧分位数(分位点)的定义位点)的定义.它在计算概率查表时经常使它在计算概率查表时经常使用用.这里请看演示这里请看演示.分位数分
14、位数第四讲第四讲 统计量与抽样分布统计量与抽样分布 由由样样本本值值去去推推断断总总体体情情况况,需需要要对对样样本本值值进进行行“加加工工”,这这就就要要构构造造一一些些样样本本的的函函数数,它它把把样样本本中中所所含含的的(某某一一方方面面)的的信息集中起来信息集中起来.1.统计量统计量这种这种不含任何未知参数的样本的函数不含任何未知参数的样本的函数称为统计量称为统计量.它是完全由样本决定的量它是完全由样本决定的量.几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差它反映了总体它反映了总体均值的信息均值的信息它反映了总体它反映了总体方差的信息方差的信息定义定义:为总体为总体X的一
15、个容量为的一个容量为n的样的样本,本,是定义在样本空间上是定义在样本空间上不不依赖于未知参数依赖于未知参数的一个连续函数。则称随机的一个连续函数。则称随机变量变量为一个统计量。为一个统计量。样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩k=1,2,它反映了总体它反映了总体k 阶原点阶原点矩的信息矩的信息它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的信息顺序统计量定义顺序统计量定义:为总体为总体X的的一个容量为一个容量为n的样本,的样本,是样本的一个是样本的一个观察值,将它们按大小次序排列,有观察值,将它们按大小次序排列,有称称为第为第i个顺序统计量,如果无论样本个顺序统计量,如果无
16、论样本取怎样一组观察值取怎样一组观察值,总是取其中总是取其中的为观察值(的为观察值(i=1,2,n).显然,显然,称为称为最小和最大统计量最小和最大统计量。、2.样本中位数样本中位数用于估计总体均值用于估计总体均值样本极差:样本极差:用于估计总体方差用于估计总体方差3.抽样分布抽样分布统计量分布统计量分布样本函数分布样本函数分布统计量既然是依赖于样本的,而统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个机变量,因而就有一定的分布,这个分布叫做分布叫做统计量的统计量的“抽样分布抽样分布”.当总体为当总体为正态分布正态分布
17、时,教材上给出了时,教材上给出了几个重要的抽样分布定理几个重要的抽样分布定理.这里我们不加这里我们不加证明地叙述证明地叙述.除定理除定理2外,其它几个定理外,其它几个定理的证明都可以在教材上找到的证明都可以在教材上找到.4.几个重要的抽样分布定理几个重要的抽样分布定理定理定理1(样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有n取不同值时样本均值取不同值时样本均值的分布的分布定理定理2(样本方差的分布样本方差的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有n取不
18、同值时取不同值时的分布的分布定理定理3设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有定理定理4(两总体样本均值差的分布两总体样本均值差的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,则有则有Y1,Y2,是是样本样本定理定理5(两总体样本方差比的分布两总体样本方差比的分布)分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值,均值,则有则有Y1,Y2,是是样本样本例例1.为总体为总体X的一个容量为的一个容量为n的样本,的样本,为样本均值为样本均值,为样本方差为样本方差,求求解解:上述上述5个抽样分布定理很重要,个抽样分布定理很重要,要牢固掌握要牢固掌握.