《《样本及其抽样分布》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《样本及其抽样分布》PPT课件.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 前面五章我们讲述了概率论的基本内容,随后的三章将讲述数理统计数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的带有随机性的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断 数理统计的内容包括:如何收集、整理数据资料;如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断后者就是我们所说的统计推断问题。本书只讲述统计推断的基本内容。第六章我们介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布第六章 样本及抽样分布第一节 总体与样本第二节 直方图第三节 抽样分布第一节第一节 总体与样本总体与样本一、总体和
2、表征总体的随机变量一、总体和表征总体的随机变量 例如例如 研究某企业生产的一批电视机显象管的平研究某企业生产的一批电视机显象管的平均使用寿命,那么这一批显象管的全体就组成一均使用寿命,那么这一批显象管的全体就组成一个总体,其中每一只显象管就是一个个体。个总体,其中每一只显象管就是一个个体。总体总体研究对象的全体研究对象的全体个体个体每一个对象每一个对象例如例如 研究某大学一年级学生的身高情况,这时一研究某大学一年级学生的身高情况,这时一年级大学生的全体就是总体;每个大学生就是一年级大学生的全体就是总体;每个大学生就是一个个体。个个体。某工厂某工厂10月份生产的灯泡寿命所组成的月份生产的灯泡寿命
3、所组成的总体中总体中,个体的总数就是个体的总数就是10月份生产的灯泡数月份生产的灯泡数,这是一个有限总体这是一个有限总体;而该工厂生产的所有灯泡寿而该工厂生产的所有灯泡寿命所组成的总体是一个无限总体命所组成的总体是一个无限总体,它包括以往生它包括以往生产和今后生产的灯泡寿命产和今后生产的灯泡寿命.有限总体和无限总体有限总体和无限总体例例如如 当有限总体包含的个体的当有限总体包含的个体的总数很大时总数很大时,可近似地将它看可近似地将它看成是无限总体成是无限总体.在实际中我们真正所关心的是总体的某种数在实际中我们真正所关心的是总体的某种数量指标,例如显象管的寿命指标量指标,例如显象管的寿命指标X,
4、学生的身高,学生的身高指标指标Y,它们都是,它们都是r.v.(意思是:从中任取一只意思是:从中任取一只显显象管象管,其寿命是不能预先确定的,可看作是,其寿命是不能预先确定的,可看作是X的的可能取值)。称这样的可能取值)。称这样的r.v.r.v.为为表征总体的随机变表征总体的随机变量量。为了方便起见,我们就将为了方便起见,我们就将表征总体的随机变表征总体的随机变量量的所有可能取值的全体看作总体。的所有可能取值的全体看作总体。若若X的分布函数为的分布函数为F(x),则称总体的分布函数为,则称总体的分布函数为F(x)。总体总体 r.v.X(Y)二、样本二、样本 对总体进行研究时,对总体中每个个体逐一
5、对总体进行研究时,对总体中每个个体逐一进行考察,这在实际中往往是行不通的,一是试进行考察,这在实际中往往是行不通的,一是试验具有破坏性,二是需花费大量的人力物力;验具有破坏性,二是需花费大量的人力物力;常用的方法是:从总体中随机地抽取若干个常用的方法是:从总体中随机地抽取若干个个体,根据对这部分个体的研究结果推断总体某个体,根据对这部分个体的研究结果推断总体某方面的特征。方面的特征。定义定义 从总体从总体X中随机地抽取中随机地抽取n个个体,称之为个个体,称之为总体总体X的一个的一个样本容量样本容量为为n的样本。的样本。假设抽样满足下述两个条件:假设抽样满足下述两个条件:(1)随机性随机性 为了
6、使样本具有充分的代表性,抽样必为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的须是随机的,应使总体中的每一个个体都有同等的机会被抽取到机会被抽取到。(2)独立性独立性 各次抽样必须是相互独立的,即每次抽各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。它各次抽样结果的影响。这种随机的、独立的抽样方法称为这种随机的、独立的抽样方法称为简单随机抽样简单随机抽样,由此得到的样本称为由此得到的样本称为简单随机样本简单随机样本今后,凡是提今后,凡是提到抽样与样本,都是指简单随机抽样
7、与简单随机样到抽样与样本,都是指简单随机抽样与简单随机样本。本。从总体中抽取若干个个体的过程称为从总体中抽取若干个个体的过程称为抽样抽样例如例如 总体总体X是一批显象管的使用寿命,现从总是一批显象管的使用寿命,现从总体体X中抽取中抽取n个显象管,个显象管,Xi表示抽到的第表示抽到的第i个显象个显象管的使用寿命,管的使用寿命,i=1,2,n;由于抽取的随机性,;由于抽取的随机性,显然,每一个显然,每一个Xi 都是随机变量,并且有着和总体都是随机变量,并且有着和总体X相同的分布。另外,由于抽取的独立性,相同的分布。另外,由于抽取的独立性,相互独立。相互独立。记记 为总体为总体X的一个样本容量为的一
8、个样本容量为n的样本。的样本。其中其中Xi表示第表示第i个个体的某个数量指标,是一个个个体的某个数量指标,是一个r.v.。且且 独立同分布(与总体独立同分布(与总体X同分布)。同分布)。从总体从总体X中抽取一个个体,就是对中抽取一个个体,就是对X进行一次试进行一次试验(或观测),得到一个试验数据(或观测值)。验(或观测),得到一个试验数据(或观测值)。因此对于一次具体的抽样观测结果,我们将得到一因此对于一次具体的抽样观测结果,我们将得到一组数据,组数据,记作记作 ,称之为样本的一次观,称之为样本的一次观测值(样本值)。测值(样本值)。例如例如 从某厂生产的显象管中随机抽取从某厂生产的显象管中随
9、机抽取10个显象管,个显象管,测得寿命如下(单位千小时):测得寿命如下(单位千小时):4.8,3.4,5.2,4.7,5.5,4.2,4.5,3.9,5.0,4.9 这十个数据就是样本容量为这十个数据就是样本容量为10的样本的样本 的一组观测值的一组观测值 。若将样本若将样本 ,看作是一看作是一n维随机维随机变变量量 ,则则 (1)当总体当总体 是离散型随机变量是离散型随机变量,若记其分布若记其分布律为律为 ,则样本则样本的联合分布律为:的联合分布律为:(1)(2)当总体当总体 是连续型随机变量是连续型随机变量,且具有概率且具有概率密度函数密度函数 时时,则样本则样本 的的联合概率密度为联合概
10、率密度为(2)解解例例1 1解解例例2 2一、频数与频率分布表一、频数与频率分布表 数据的采集数据的采集:从总体中随机地抽取一个样本,对样从总体中随机地抽取一个样本,对样本进行一次观测,得到一组数据。本进行一次观测,得到一组数据。例例 从某地一次数学统测的成绩中,随机抽从某地一次数学统测的成绩中,随机抽取取30个学生的成绩如下:个学生的成绩如下:85 90 77 71 96 68 61 83 74 80 95 87 88 76 73 83 63 81 94 82 9678 88 76 82 77 79 91 72 71 66第二节 直方图v排序(从小到大);排序(从小到大);61 63 66
11、68 71 71 72 73 74 7676 77 77 78 79 80 81 82 82 83 83 85 87 88 88 90 91 94 95 96(1)找出最大值,最小值,并计算极差)找出最大值,最小值,并计算极差R;R=最大值最大值-最小值最小值=96-61=35。极差极差R反映了数据波动的幅度。反映了数据波动的幅度。(2)对数据进行分组(等区间分组),确定分组对数据进行分组(等区间分组),确定分组 的个数的个数k k;选取适当的区间长度(组距);选取适当的区间长度(组距)d d;n=30,取,取k=6,则,则 。(3)确定各组的上、下限(每组不含上限);)确定各组的上、下限(每
12、组不含上限);(4)列表得各组的组频数;)列表得各组的组频数;数出数据落入各个组区间中的个数。数出数据落入各个组区间中的个数。(5)计算各组的组频率。)计算各组的组频率。组频率组频率=组频数组频数数据总数数据总数得到得到频率分布表频率分布表组号组区间组频数组频率60.5-66.5 0.166.572.5 0.13372.578.5 0.23378.584.5 0.23394.590.5 0.16690.596.5 0.133总计301表表1二、频数与频率直方图二、频数与频率直方图 在平面坐标上,在平面坐标上,x x轴表示所考察的变量,轴表示所考察的变量,y y轴表轴表示频数,示频数,以表以表1
13、 1为例,在横轴上标出为例,在横轴上标出6 6个等长的区个等长的区间,在纵轴上标出频数,间,在纵轴上标出频数,以区间组距为底边,各组以区间组距为底边,各组的组频数为高作矩形,就得到了频数直方图的组频数为高作矩形,就得到了频数直方图。若若y轴取为组频率,按上述方法就得到了频率直方图轴取为组频率,按上述方法就得到了频率直方图v频数直方图与频率直方图形状相似;频数直方图与频率直方图形状相似;v对于对于连续型连续型r.v.,频率直方图可作为其概率密度函频率直方图可作为其概率密度函 数曲线的一种近似。数曲线的一种近似。说明说明第三节第三节 抽样分布抽样分布一、基本概念一、基本概念二、常见分布二、常见分布
14、一、基本概念一、基本概念1.统计量的定义统计量的定义是是不是不是例例12.几个常用统计量的定义几个常用统计量的定义(1)样本平均值样本平均值(2)样本方差样本方差其观察值其观察值其观察值其观察值(3)样本标准差样本标准差其观察值其观察值例例2 2 从某高校一年级男生中任意抽取从某高校一年级男生中任意抽取1212名,测得他们的名,测得他们的身高如下(单位:身高如下(单位:cmcm):):171171,165165,174174,175175,168168,164164,173173,178178,168168,170170,172172,173173试估计该年级男生的平均身高,并估计其方差和标准
15、差试估计该年级男生的平均身高,并估计其方差和标准差解:解:3.经验分布函数经验分布函数经验分布函数的做法如下经验分布函数的做法如下:也称样本分布函数也称样本分布函数例例3例例4一般地,一般地,样本分布函数样本分布函数 的图形如图所示的图形如图所示 可作为总体分布函数的一个近似,可作为总体分布函数的一个近似,n越越大,近似得越好大,近似得越好。例例二、三个重要分布二、三个重要分布统计量的分布称为抽样分布统计量的分布称为抽样分布.1.性质性质1(此性质可以推广到多个随机变量的情形此性质可以推广到多个随机变量的情形.)性质性质2证明证明例例1例例2 设设,试确定,试确定 的值,使之满足:的值,使之满
16、足:解解t 分布又称分布又称学生氏学生氏(Student)分布分布.2.当当 n 充分大时充分大时,其其图形类似于标准正图形类似于标准正态变量概率密度的态变量概率密度的图形图形.由分布的对称性知由分布的对称性知例例3例例4 设设,试确定,试确定 的值,使之满足:的值,使之满足:解解3.根据定义可知根据定义可知,例例5例例6 设总体设总体X(不管服从什么分布,只要均值和方(不管服从什么分布,只要均值和方差存在)的均值为差存在)的均值为 ,方差为,方差为 ,是来自总体是来自总体X的样本,的样本,分别是样本均值和样本分别是样本均值和样本方差,则有方差,则有结论结论定理定理三、三、正态总体的样本均值和样本方差的分布正态总体的样本均值和样本方差的分布证明证明且两者独立且两者独立,由由 t 分布的定义知分布的定义知