《概率论 第六章精选PPT.ppt》由会员分享,可在线阅读,更多相关《概率论 第六章精选PPT.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率论 第六章第1页,此课件共63页哦第六章第六章 样本及抽样分布样本及抽样分布n引言引言n随机样本随机样本n抽样分布抽样分布第2页,此课件共63页哦本章转入课程的第二部分本章转入课程的第二部分数理统计数理统计 数理统计的特点是应用面广,分支较多数理统计的特点是应用面广,分支较多.社会社会的发展不断向统计提出新的问题的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必有力的技术支持,数理统计与计算机的结合是必然的发展趋势然的发展趋势.引言引言第3页,此课件共63页哦 学习统计无须把过多时间化在计算上
2、,可以更有学习统计无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SAS,SPSS,MATLAB,STAT等,都可以让你快速、简便地进行等,都可以让你快速、简便地进行数据处理和分析数据处理和分析.第4页,此课件共63页哦 从历史的典籍中,人们不难发现许多关于钱从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作早就开始了统计的工作.但是当时的统计,只是但是当时的统计,只是对有关事实的
3、简单记录和整理,而没有在一定理对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断论的指导下,作出超越这些数据范围之外的推断.第5页,此课件共63页哦 到了十九世纪末二十世纪初,随着近代数学和到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了概率论的发展,才真正诞生了数理统计学数理统计学这门学科这门学科.数理统计学是一门应用性很强的学科数理统计学是一门应用性很强的学科.它是研究怎它是研究怎样以样以有效的方式有效的方式收集、收集、整理和分析整理和分析带有随机性的带有随机性的数据数据,以便对所考察的问题作出推断和预测,直至为,以便对所考察的问题作出推
4、断和预测,直至为采取一定的决策和行动提供依据和建议采取一定的决策和行动提供依据和建议.第6页,此课件共63页哦目前地震预测研究有目前地震预测研究有3 3种不同的思路种不同的思路:地震地质地震地质。地震统计地震统计。对过去已发生的地震,运用。对过去已发生的地震,运用数理统计数理统计方方法,法,从中发现地震发生的规律,特别是时间序列的规律,从中发现地震发生的规律,特别是时间序列的规律,根据过去以推测未来根据过去以推测未来。此法把地震问题归结为数学问题。此法把地震问题归结为数学问题。因需要对大量地震资料作统计,研究的区域往往过大,因需要对大量地震资料作统计,研究的区域往往过大,所以判定地震的地点有困
5、难,而且外推常常不准确。所以判定地震的地点有困难,而且外推常常不准确。地震前兆地震前兆。第7页,此课件共63页哦 数理统计不同于一般的资料统计,它更侧重于应用数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而由于大量随机现象必然呈现出它的规律性,因而从理论上讲从理论上讲,只要对随机现象进行足够多次观察,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来被研究的随机现象的规律性一定能清楚地呈现出来.但客观上只允许我们对随机现象进行但客观上只允
6、许我们对随机现象进行次数不多的观察试验,也就是说次数不多的观察试验,也就是说,我们获得的只是我们获得的只是局部观察资料局部观察资料.第8页,此课件共63页哦 在在概率论中所研究的随机变量,它的分布都是假设概率论中所研究的随机变量,它的分布都是假设已知的已知的,在这一前提下去研究它的性质、特点和规律在这一前提下去研究它的性质、特点和规律性性,例如求出它的数字特征例如求出它的数字特征,讨论随机变量函数的分讨论随机变量函数的分布布,介绍常用的各种分布等。介绍常用的各种分布等。而在而在数理统计中的随机变量,它的分布是未知的,数理统计中的随机变量,它的分布是未知的,或者不完全知道或者不完全知道,人们通过
7、对所研究的随机变量进,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。据进行分析,从而对随机变量的分布作出种种判断。第9页,此课件共63页哦 现实世界中存在着形形色色的数据现实世界中存在着形形色色的数据,分析这些数据分析这些数据需要多种多样的方法需要多种多样的方法.因此因此,数理统计中的方法和支持这些方法的相应理论数理统计中的方法和支持这些方法的相应理论是相当丰富的是相当丰富的.概括起来可以归纳成两大类概括起来可以归纳成两大类:参数估计参数估计根据数据根据数据,用一些方法对分布的未
8、知参用一些方法对分布的未知参数进行估计数进行估计.假设检验假设检验根据数据根据数据,用一些方法对分布的未知参用一些方法对分布的未知参数进行检验数进行检验.它们构成了统计推断的两种基本形式它们构成了统计推断的两种基本形式.这两种推断渗这两种推断渗透到了数理统计的每个分支透到了数理统计的每个分支.第10页,此课件共63页哦6.1 6.1 随机样本随机样本总体和样本总体和样本第11页,此课件共63页哦 在数理统计中,不是对所研究的对象全体在数理统计中,不是对所研究的对象全体(称为称为总体总体)进行观察,而是抽取其中的部分进行观察,而是抽取其中的部分(称为称为样本样本)进行观察进行观察获得数据获得数据
9、(抽样抽样),并通过这些数据对总体进行推断,并通过这些数据对总体进行推断.数理统计方法具有数理统计方法具有“部分推断整体部分推断整体”的特征的特征.第12页,此课件共63页哦 实际上实际上,我们真正关心的并不是研究对象本身我们真正关心的并不是研究对象本身,而而是其某项数量指标是其某项数量指标.比如某家工厂的一种产品的使用寿命这样一项比如某家工厂的一种产品的使用寿命这样一项数量指标数量指标.1.1.总体总体某批某批灯泡的寿命灯泡的寿命该批灯泡寿命的全该批灯泡寿命的全体就是总体体就是总体国产轿车每公里国产轿车每公里的耗油量的耗油量国产轿车每公里耗油量国产轿车每公里耗油量的全体就是总体的全体就是总体
10、第13页,此课件共63页哦 对研究对象上的某项数量指标进行观察。对研究对象上的某项数量指标进行观察。试验的全部可能的观察值称为试验的全部可能的观察值称为总体总体.这些值不一定各不相同这些值不一定各不相同(可能重复可能重复),数目上也不,数目上也不一定有限一定有限.每一个可能的观察值称为每一个可能的观察值称为个体个体.总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体总体有限总体有限总体无限总体无限总体第14页,此课件共63页哦 例例1 研究某地区研究某地区N个农户的年收人个农户的年收人.在上面的例子中在上面的例子中,总体是很直观的总体是很直观的,是看得是看得见摸
11、得着的见摸得着的.但是客观情况并不总是这样但是客观情况并不总是这样.注意注意总体指他们的年收入的总体指他们的年收入的N个数字个数字.例例2 用一把尺子去量一个物体的长度用一把尺子去量一个物体的长度.总体应该理解为一切所有可能的测量值的全体总体应该理解为一切所有可能的测量值的全体.第15页,此课件共63页哦 对一个总体对一个总体,如果我们用如果我们用X表示它的数量指标表示它的数量指标,那么那么X的值对不同的个体取不同的值的值对不同的个体取不同的值.因此因此,如果我们随机如果我们随机地抽取个体地抽取个体,则则X的值也就随着抽取的个体的不同而不的值也就随着抽取的个体的不同而不同同.所以所以X是一个随
12、机变量是一个随机变量!2 2、总体的分布、总体的分布 既然总体是随机变量既然总体是随机变量X,自然就有其概率分布自然就有其概率分布.我们我们把把X的分布称为的分布称为总体的分布总体的分布.总体的特性是由总体分布来刻画的总体的特性是由总体分布来刻画的.因此因此,我们常把我们常把总体和总体分布总体和总体分布视为同义语视为同义语.第16页,此课件共63页哦 例例l中,若农户年收入以万元计中,若农户年收入以万元计,假定假定N户中收入户中收入X为以下几种取值为以下几种取值:0.5,0.8,l,1.2和和1.5.取这些值的农户个数分别为:取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里这里n
13、1+n2+n3+n4+n5=N).例例3 (例例l续续)则总体则总体X的分布为离散型分布的分布为离散型分布,其分布律为其分布律为:第17页,此课件共63页哦 例如例如:研究某批灯泡的寿命时,关心的数量指标就研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量是寿命,那么,此总体就可以用随机变量X表示,或用表示,或用其分布函数其分布函数F(x)表示表示.寿命寿命 X 可用指数分布来可用指数分布来刻划刻划 鉴于此,常用随机变量的记号或鉴于此,常用随机变量的记号或用其分布函数表示总体用其分布函数表示总体.如说总体如说总体X或总体或总体F(x).某批某批灯泡的寿命灯泡的寿命总总体
14、体 寿命总体是指数分布总体寿命总体是指数分布总体第18页,此课件共63页哦 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时,若关,若关心的数量指标是身高和体重,我们用心的数量指标是身高和体重,我们用X 和和Y 分别表示身高分别表示身高和体重,那么此总体就可用二维随机变量和体重,那么此总体就可用二维随机变量(X,Y)或其联合或其联合分布函数分布函数 F(x,y)来表示来表示.第19页,此课件共63页哦 总体分布一般是未知总体分布一般是未知,或只知道是包含未知参数或只知道是包含未知参数的分布的分布,为推断总体分布及各种特征为推断总体分布及各种特征,按一定规则从总体按一
15、定规则从总体中抽取若干个体进行观察试验中抽取若干个体进行观察试验,以获得有关总体的信息以获得有关总体的信息,这一抽取过程称为这一抽取过程称为“抽样抽样”,所抽取的部分个体称为所抽取的部分个体称为样样本本.样本中所包含的个体数目称为样本中所包含的个体数目称为样本容量样本容量.3.样本样本从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5第20页,此课件共63页哦当当n次观察一经完成次观察一经完成,得到得到n个具体的数个具体的数 x1,x2,xn,称称为样本为样本X1,Xn的一次观察值的一次观察值,简称简称样本值样本值.1.代表性代表性:X1,X2,Xn中每一个与
16、所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2.独立性独立性:X1,X2,Xn是相互独立的随机变量是相互独立的随机变量.对总体对总体X在相同的条件下在相同的条件下,进行进行n次重复、独立观察次重复、独立观察,其结果依次记为其结果依次记为X1,X2,Xn,这样得到的随机变量这样得到的随机变量X1,X2,Xn是来自总体是来自总体X的一个的一个简单随机样本简单随机样本,与总体随机变与总体随机变量具有相同的分布量具有相同的分布.n是样本的容量是样本的容量.这种抽样这种抽样,叫作叫作“简单随机抽样简单随机抽样”,其特点:其特点:第21页,此课件共63页哦 对对有限总体有限总体,采用放回
17、抽样可得简单随机样本采用放回抽样可得简单随机样本,但放回但放回抽样使用起来不方便抽样使用起来不方便,当个体总数当个体总数N比要得到的样本的容比要得到的样本的容量量n大得多时大得多时,在实际中可将不放回抽样近似当作放回抽在实际中可将不放回抽样近似当作放回抽样来处理样来处理.对对无限总体无限总体,因抽取一个个体不影响它的分布因抽取一个个体不影响它的分布,所以所以总是采用不放回抽样总是采用不放回抽样.第22页,此课件共63页哦定义:定义:设设X是具有分布函数是具有分布函数F的随机变量,若的随机变量,若X1,X2,Xn是具有同一分布函数的、相互独立的随机变量,则称是具有同一分布函数的、相互独立的随机变
18、量,则称X1,X2,Xn为从分布函数为从分布函数F(或总体或总体F、或总体、或总体X)得到的容量得到的容量为为n的的简单随机样本简单随机样本,简称,简称样本样本,它们的观察值,它们的观察值x1,x2,xn称为称为样本值样本值,又称为,又称为X的的n个独立的观察值个独立的观察值.简单随机样本是应用中最常见的情形,今后,当简单随机样本是应用中最常见的情形,今后,当说到说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,若不时,若不特别说明,就指简单随机样本特别说明,就指简单随机样本.第23页,此课件共63页哦 既然样本既然样本 X1,X2,Xn 被看作随机变量被看作随机变量,自然就需要
19、研究自然就需要研究它们的分布它们的分布4.4.样本的分布样本的分布=F(x1)F(x2)F(xn)若总体的分布函数为若总体的分布函数为F(x)、概率密度函数为、概率密度函数为f(x),则则其简单随机样本的联合分布函数为其简单随机样本的联合分布函数为其简单随机样本的联合概率密度函数为其简单随机样本的联合概率密度函数为=f(x1)f(x2)f(xn)第24页,此课件共63页哦 假设某大城市居民的收入服从正态分布假设某大城市居民的收入服从正态分布 N(,2),其概率密度函数为其概率密度函数为:例例5 5设设X1,X2,Xn是来自总体的一个样本是来自总体的一个样本.则则 Xi N(,2),i1,2,n
20、.于是样本于是样本 X1,X2,Xn的联合概率密度的联合概率密度为第25页,此课件共63页哦 事实上我们抽样后得到的资料都是具体的、确定的事实上我们抽样后得到的资料都是具体的、确定的值值.如我们从某班大学生中抽取如我们从某班大学生中抽取10人测量身高人测量身高,得到得到10个数,它们是样本取到的值而不是样本个数,它们是样本取到的值而不是样本.我们只能观察到我们只能观察到随机变量取的值而见不到随机变量随机变量取的值而见不到随机变量.4.总体、样本、样本值的关系总体、样本、样本值的关系第26页,此课件共63页哦总体(理论分布)总体(理论分布)?样本样本 样本值样本值 统计是从手中已有的资料统计是从
21、手中已有的资料样本值,去推断总体的情样本值,去推断总体的情况况-总体分布总体分布F(x)的性质的性质.总体分布决定了样本取值的概率规律,也就是样本取总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁样本是联系二者的桥梁第27页,此课件共63页哦休息片刻继续下一讲休息片刻继续下一讲第28页,此课件共63页哦6.2 6.2 抽样分布抽样分布统计量与经验分布函数统计量与经验分布函数统计三大抽样分布统计三大抽样分布几个重要的抽样分布定理几个重要的抽样分布定理课堂练习课堂练习布置作业布置作业第29页,此
22、课件共63页哦 由由样样本本值值去去推推断断总总体体情情况况,需需要要对对样样本本值值进进行行“加加工工”,这这就就要要构构造造一一些些样样本本的的函函数数,它它把把样样本本中所含的(某一方面)的信息集中起来中所含的(某一方面)的信息集中起来.1.统计量统计量 这种不含任何未知参数的样本的函数称为这种不含任何未知参数的样本的函数称为统计统计量量.它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数第30页,此课件共63页哦定义:定义:设设X1,Xn 是来自总体是来自总体X的一个样本的一个样本,g(X1,Xn)是是X1,Xn的函数的函数,若若g中不含未知
23、参数中不含未知参数,则称则称g(X1,Xn)是总体是总体X的一个的一个统计量统计量.设设X1,Xn 是来自总体是来自总体X的一个样本的一个样本,x1,xn 是样本是样本X1,Xn的一个观察值的一个观察值,则则 g(x1,xn)是统计量是统计量g(X1,Xn)的观察值的观察值.例:设例:设X1,Xn 是总体是总体X的一个样本的一个样本,XN(,2),令令T=X1-,若若 为已知的为已知的,则则T为统计量为统计量;若若 未知未知,T就不是统计量就不是统计量.第31页,此课件共63页哦几个常用的统计量及其观察值几个常用的统计量及其观察值 :1.1.样本均值样本均值 2.2.样本方差样本方差 样本标准
24、差样本标准差 它反映了它反映了总体均值总体均值的信息的信息它反映了总体它反映了总体方差的信息方差的信息第32页,此课件共63页哦3.3.样本样本k阶原点矩阶原点矩4.4.样本样本k阶中心矩阶中心矩它反映了总体它反映了总体k 阶矩的信息阶矩的信息它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的信息第33页,此课件共63页哦统计量的观察值统计量的观察值第34页,此课件共63页哦结论结论:若总体若总体X的的k阶原点矩阶原点矩存在存在,则当则当n趋于趋于时时证明证明:辛钦定理辛钦定理 及依概率收敛的序列的性质及依概率收敛的序列的性质.第七章矩估计法的理论根据第七章矩估计法的理论根据第35页,此课件
25、共63页哦经验分布函数经验分布函数是与总体是与总体X的分布函数的分布函数F(x)相应的统相应的统计量计量.设设X1,X2,Xn,是总体是总体F的一个样本的一个样本,令令S(x)表示表示X1,X2,Xn中不大于中不大于x的随机变量的个数的随机变量的个数.定义经验分布函定义经验分布函数数Fn(x)为:为:对于一个样本值对于一个样本值 x1,x2,xn,经验分布函数经验分布函数Fn(x)的的观察值仍记为观察值仍记为Fn(x).2.经验分布函数经验分布函数第36页,此课件共63页哦例例1:设总体:设总体F具有一个样本具有一个样本1,2,3,则经验分布函数则经验分布函数F3(x)的观察值为的观察值为例例
26、2:若样本值为:若样本值为1,1,2,则经验分布函数则经验分布函数F3(x)的观察值的观察值为为第37页,此课件共63页哦 一般地一般地,设设x1,x2,xn,是总体是总体F的一个容量为的一个容量为n的样的样本值本值,要求经验分布函数的观察值要求经验分布函数的观察值.首先将首先将 x1,x2,xn,按由小到大的顺序排列按由小到大的顺序排列,并重新编号并重新编号,设为设为x(1)x(2)x(n),则经验分布函数则经验分布函数Fn(x)的观察值为的观察值为,对不同的样本值对不同的样本值,得到得到的经验分布函数不同的经验分布函数不同.但当但当样本容量较大时样本容量较大时,经验分经验分布函数布函数Fn
27、(x)是总体分布函是总体分布函数数F(x)的良好近似的良好近似.第38页,此课件共63页哦 统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布:2 2分布、t t 分布和F F分布。第39页,此课件共63页哦1.定义定义:设设X1,X2,Xn相互独立相互独立,都服从正态分布都服从正态分布N(0,1),则称随机变量:则称随机变量:所服从的分布为所服从的分布为自由度为自由度为 n 的的2分布分布.二、三大抽样分布二、三大抽样分布记为记为2 分布分布第40页,此课件共63页哦2.2 分布的密度函数分布的密度函数 f(y)曲线曲线第41页,此课件共63页哦3.分位点分位点 设设X 2(n
28、),若对于,若对于:0 34.382的值的值;2)若若 P 2b=0.975,求求b的值的值.b.分布可加性分布可加性 若若X 2(n1),Y 2(n2),X,Y相互独立相互独立,则则 X+Y 2(n1+n2).第43页,此课件共63页哦c.期望与方差期望与方差 若若X 2(n),则,则E(X)=n,D(X)=2n.d若若X 2(n),则当,则当n充分大时充分大时,近似正态分布近似正态分布N(0,1).第44页,此课件共63页哦1.定义定义 若若XN(0,1),Y 2(n),X与与Y独立,则独立,则2.t(n)称为自由度为称为自由度为n的的t 分布分布.t 分布分布第45页,此课件共63页哦t
29、(n)的概率密度为的概率密度为第46页,此课件共63页哦2.性质性质第47页,此课件共63页哦3.分位点分位点 设设tt(n),若对若对:0 0,4.满足满足Pt t(n)=,则称,则称t(n)为为5.t(n)的上的上 分位点分位点.第48页,此课件共63页哦 注注:第49页,此课件共63页哦第50页,此课件共63页哦1.定义定义 若若U 2(n1),V 2(n2),U,V独立,则独立,则 称为第一自由度为称为第一自由度为n1,第二自由度为第二自由度为n2的的F分布分布。F 分布分布注注:若若FF(n1,n2),则则1/FF(n2,n1).第51页,此课件共63页哦F分布的概率密度函数分布的概
30、率密度函数若若FF(n1,n2),F的概率密度为的概率密度为第52页,此课件共63页哦2.F分布的分位点分布的分位点对于对于:0 0,满足满足PFF(n1,n2)=,则则称称F(n1,n2)为为F(n1,n2)的上的上 分位点;分位点;注:注:第53页,此课件共63页哦第54页,此课件共63页哦三、正态总体的样本均值和样本方差的分布三、正态总体的样本均值和样本方差的分布 设设总总体体X的的均均值值为为,方方差差为为 2,X1,X2,Xn 是是来来自自总总体体X的的一一个个样样本本,则则样样本本均均值值 X 和和样样本本方方差差S2 有下面结论成立有下面结论成立,第55页,此课件共63页哦 定理
31、定理 1 1 (样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有第56页,此课件共63页哦 定理定理 2 (样本方差的分布样本方差的分布)设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有(1)相互独立相互独立 第57页,此课件共63页哦证明证明:且且U与与V独立独立,根据根据 t 分布的定义分布的定义第58页,此课件共63页哦 定理定理 3 (样本方差比的分布及样本均值差的分布样本方差比的分布及样本均值差的分布)且这两个样本相互独立且这两个样本相互独立设设X1,X2,与
32、与Y1,Y2,分别是来自正态总体分别是来自正态总体的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,则有则有分别是这两个样本的样本均值分别是这两个样本的样本均值,设设(2)当当 时时,第59页,此课件共63页哦例例1:设总体:设总体XN(10,32),X1,Xn是它的一个样本是它的一个样本(1)写出写出Z所服从的分布所服从的分布;(2)求求PZ11.解解:因为因为Xi N(10,32),所以所以那么那么第60页,此课件共63页哦例例2:设:设X1,X10是取自是取自N(0,0.32)的样本的样本,求求解解:由题意知由题意知那么那么通过查表可得其值为通过查表可得其值为0.1.第61页,此课件共63页哦例例3:设:设X1,Xn是取自是取自N(,2)的样本的样本,求样求样本方差本方差S2的期望与方差。的期望与方差。解解:因为因为所以所以第62页,此课件共63页哦n作业:作业:1,3,5第63页,此课件共63页哦