第六章样本和统计量课件.ppt

上传人:s****8 文档编号:95156597 上传时间:2023-08-19 格式:PPT 页数:47 大小:943.50KB
返回 下载 相关 举报
第六章样本和统计量课件.ppt_第1页
第1页 / 共47页
第六章样本和统计量课件.ppt_第2页
第2页 / 共47页
点击查看更多>>
资源描述

《第六章样本和统计量课件.ppt》由会员分享,可在线阅读,更多相关《第六章样本和统计量课件.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六章第六章 样本与统计量样本与统计量6.1 引言引言6.2 总体与样本总体与样本6.3 统计量统计量6.4 正态总体正态总体 数理统计学是一门应用性很强的学科。它研究怎样以数理统计学是一门应用性很强的学科。它研究怎样以有效的方式有效的方式收集、收集、整理和分析整理和分析带有随机性的数据带有随机性的数据,以便,以便对所考察的问题作出正确的推断和预测,为采取正确的决对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。策和行动提供依据和建议。数理统计不同于一般的资料统计,它更侧重于应数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。用

2、随机现象本身的规律性进行资料的收集、整理和分析。6.1 引言引言 由于大量随机现象必然呈现出其由于大量随机现象必然呈现出其规律性规律性,因而从理论,因而从理论上讲,只要对随机现象进行上讲,只要对随机现象进行足够多次足够多次的的观察观察,随机现象的,随机现象的规律性就规律性就一定能够清楚一定能够清楚地呈现出来。地呈现出来。但是,客观上只允许我们对随机现象进行但是,客观上只允许我们对随机现象进行次数不多次数不多的观察或试验,也就是说:我们获得的只能是的观察或试验,也就是说:我们获得的只能是局部局部的或的或有有限限的观察资料。的观察资料。数理统计的任务就是研究怎样有效地数理统计的任务就是研究怎样有效

3、地收集收集、整理整理和和分分析析所获得的有限资料,并对所研究的问题尽可能地给出精所获得的有限资料,并对所研究的问题尽可能地给出精确而可靠的确而可靠的推断推断。现实世界中存在着形形色色的数据,分析这些数据需现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法。要多种多样的方法。因此,数理统计中的方法和支持这些方法的相应理论因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的。概括起来可以归纳成两大类。是相当丰富的。概括起来可以归纳成两大类。参数估计参数估计:根据数据,对分布中的未知参数进行估计;根据数据,对分布中的未知参数进行估计;假设检验假设检验:根据数据,对分布的未知参数的某

4、种假设进根据数据,对分布的未知参数的某种假设进 行检验。行检验。参数估计与假设检验参数估计与假设检验构成了统计推断的两种基本形式构成了统计推断的两种基本形式,这两种推断渗透到了数理统计的每个分支。这两种推断渗透到了数理统计的每个分支。6.2 总体与样本总体与样本 在数理统计中,称研究问题所涉及对象的全体为在数理统计中,称研究问题所涉及对象的全体为总总体体,总体中的每个成员为,总体中的每个成员为个体个体。例如例如:研究某工厂生产的某种产品的废品率,则这研究某工厂生产的某种产品的废品率,则这种产品的全体就是总体,而每件产品都是一个个体。种产品的全体就是总体,而每件产品都是一个个体。6.2.1 6.

5、2.1 总体、个体与样本总体、个体与样本 实际上,我们真正关心的并不一定是总体或个体本实际上,我们真正关心的并不一定是总体或个体本身,而身,而真正关心的真正关心的是是总体或个体的总体或个体的某项某项数量指标。数量指标。如:某电子产品的使用寿命,某天的最高气温,加如:某电子产品的使用寿命,某天的最高气温,加工出来的某零件的长度等数量指标。工出来的某零件的长度等数量指标。因此,有时也将总因此,有时也将总体理解为那些体理解为那些研究对象的某项数量指标的全体研究对象的某项数量指标的全体。为评价某种产品质量的好坏,通常的做法是:从全为评价某种产品质量的好坏,通常的做法是:从全部产品中随机部产品中随机(任

6、意任意)地抽取一些样品进行地抽取一些样品进行观测观测(检检测测),统计学上称这些样品为统计学上称这些样品为一个一个样本样本。同样,我们也将样本同样,我们也将样本的数量指标的数量指标称为称为样本。因此,今后当我们说到总体样本。因此,今后当我们说到总体及及样样本时,既指研究对象又指它们的某项数量指标。本时,既指研究对象又指它们的某项数量指标。例例1 1:研究某地区研究某地区 N 个农户的年收人。个农户的年收人。在这里,总体既指这在这里,总体既指这 N 个农户,又指我们所关心的个农户,又指我们所关心的 N个农户的个农户的数量指标数量指标他们的年收入他们的年收入(N 个数字个数字)。如果从这如果从这

7、N 个农户中随机地抽出个农户中随机地抽出 m 个农户作为调查个农户作为调查对象,那么,这对象,那么,这 m 个农户以及他们的数量指标个农户以及他们的数量指标年收年收入入(m个数字个数字)就是样本。就是样本。注意:注意:上例中的总体是直观的,看得见、摸得着的。上例中的总体是直观的,看得见、摸得着的。但是,但是,客观情况并非总是这样。客观情况并非总是这样。例例2 2:用一把尺子测量一件物体的长度。用一把尺子测量一件物体的长度。假定假定 n 次测量值分别为次测量值分别为X1,X2,Xn.显然,在该问题中显然,在该问题中,我们把测量值我们把测量值X1,X2,Xn看成样本。但总体是什么呢看成样本。但总体

8、是什么呢?事实上,这里没有一个现实存在的个体的集合可以作事实上,这里没有一个现实存在的个体的集合可以作为上述问题的总体。可是,我们可以这样考虑,既然为上述问题的总体。可是,我们可以这样考虑,既然 n 个测量值个测量值 X1,X2,Xn 是样本,那么,总体就应该理解为是样本,那么,总体就应该理解为一切所有可能的测量值的全体。一切所有可能的测量值的全体。又如又如:为研究某种安眠药的药效,让:为研究某种安眠药的药效,让 n 个病人同时服用这个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数睡眠的小时数:X1,X2,Xn,则

9、这些数字就是样本。则这些数字就是样本。那么,什么是总体呢那么,什么是总体呢?设想让某个地区设想让某个地区(或某国家,甚至全世界或某国家,甚至全世界)所有患失眠所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。就是研究问题的总体。对一个总体,如果用对一个总体,如果用X表示其数量指标,那么,表示其数量指标,那么,X的的值对不同的个体就取不同的值。因此,如果我们随机地抽值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则取个体,则X的值也就随着抽取个体的不同而不同。的值也就随着抽取个体的不同而不同。所以,所以,X

10、是一个随机变量是一个随机变量!既然总体是随机变量既然总体是随机变量X,自然就有其概率分布。我们,自然就有其概率分布。我们把把X的分布称为的分布称为总体分布。总体分布。总体的特性是由总体分布来刻画的。因此,常把总体总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。和总体分布视为同义语。.6.2.2 6.2.2 总体分布总体分布例例 3(例例 l 续续):在在例例 l l中,若农户年收入以万元计,假定中,若农户年收入以万元计,假定 N户的收入户的收入X只取以下各值只取以下各值:0.5,0.8,l.0,1.2和和1.5。取上。取上述值的户数分别述值的户数分别n1,n2,n3,n4和

11、和n5(n1+n2+n3+n4+n5=N)。则则X为离散型分布,分布律为为离散型分布,分布律为:X0.50.811.21.5P例例4 (例例2续续):在例在例2中,假定物体真实长度为中,假定物体真实长度为(未知未知)。一般说来,测量值。一般说来,测量值X就是总体,取就是总体,取 附近值的概率要大一些,而离附近值的概率要大一些,而离 越远的值被取越远的值被取到的概率就越小。到的概率就越小。如果测量过程没有如果测量过程没有系统性误差系统性误差,则,则X取大取大于于 和小于和小于 的概率也会相等。的概率也会相等。在这种情况下,人们往往认为在这种情况下,人们往往认为X 服从均值服从均值为为,方差为,方

12、差为 2 的正态分布。的正态分布。2 2反映了测量的反映了测量的精度。于是,总体精度。于是,总体X的分布为的分布为 N(,2 2)。说明:说明:这里有一个问题,即物体长度的测这里有一个问题,即物体长度的测量值总是在其真值量值总是在其真值 的附近,它不可能取负值。的附近,它不可能取负值。而正态分布取值在而正态分布取值在(-(-,)上。那么,怎上。那么,怎么可以认为测量值么可以认为测量值X X服从正态分布呢服从正态分布呢?回答这个问题,有如下两方面的理由。回答这个问题,有如下两方面的理由。(1).(1).在前面讲过,对于在前面讲过,对于X N(,2),PP-3-3 X0,当样本大小当样本大小 n

13、增大时,上面的概率也随之增增大时,上面的概率也随之增大;大;n 趋于无穷时,上式趋近于趋于无穷时,上式趋近于 1。任给任给c 0,总有,总有例例1:用用机机器器向向瓶瓶子子里里灌灌装装液液体体洗洗涤涤剂剂,规规定定每每瓶瓶装装 毫毫升升。但但实实际际灌灌装装量量总总有有一一定定波波动动。假假定定灌灌装装量量的的方方差差 2 2=1=1,如如果果每每箱箱装装这这样样的的洗洗涤涤剂剂 25 瓶瓶。求求这这 25 瓶瓶洗洗净净剂剂的的平平均均灌灌装装量量与与标标定定值值 相相差差不不超超过过0.3毫毫升升的的概概率率;又又如如果果每箱装每箱装5050瓶时呢瓶时呢?解:解:记一箱中记一箱中 25 瓶洗

14、净剂灌装量为瓶洗净剂灌装量为 X1,X2,X25 是来自均值为是来自均值为 ,方差为方差为1的总体的随机样的总体的随机样本。根据抽样分布定理本。根据抽样分布定理1,近似地有,近似地有 当当 n=50=50时,时,同样可算出:同样可算出:6.4 正态总体正态总体6.4.1 2 分布分布它是由正态分布派生出来的一种分布。它是由正态分布派生出来的一种分布。定义定义1:设设 X1,X2,Xn 相互独立相互独立,且均,且均服从正态服从正态分布分布 N(0,1),则称随机变量则称随机变量服从自由度为服从自由度为 n 的的卡方卡方分布,记成分布,记成 2 。2分布的密度函数为分布的密度函数为其中其中G G(

15、)为伽玛为伽玛(Gamma)函数,通过积分函数,通过积分 来定义来定义由由 2 分布的定义,不难得到其如下性质:分布的定义,不难得到其如下性质:进一步,由中心极限定理可以推出进一步,由中心极限定理可以推出,n 充充分大时近分大时近 似于标准正态分布似于标准正态分布 N(0,1)。,2分布密度函数图形分布密度函数图形n=4n=9n=14n=19 n2 2 分布上分布上 分位点有表分位点有表可查,见附表可查,见附表4 4。对于对于给定的给定的(0,1),(0,1),称满足条件称满足条件的点的点 n2()为为 n n2 2分布的上分布的上(右右)分位点。分位点。n2分布分位点分布分位点xf(x)n2

16、()t 分布的概率分布的概率密度为密度为为服从自由度为服从自由度 n 的的 t 分布,记为分布,记为 T tn。6.4.2 t 分布分布 定义定义2:设设 X N(0,1),Y n2,且且 X与与Y 相互独相互独立,则称随机变量立,则称随机变量数学期望与方差数学期望与方差t 分布的概率分布的概率密度图形密度图形当当 n 充分大时充分大时,f(x;n)趋近于标准正态分布的概率密度。趋近于标准正态分布的概率密度。n=1n=4n=9标准正态分布标准正态分布若若 T tn,对给定的对给定的 (0,1)(0,1),称满足条件称满足条件t 分布的分位点分布的分位点的点 tn()为为 tn 分布上分布上 分

17、位点。分位点。t 分布的上分布的上 分位点有表分位点有表可查,见附表可查,见附表3 3。tn()tn(x)x tn 分布上分布上 分位点分位点示意图示意图6.4.3 F 分布分布定义:定义:设设 m2,n2;且与相互独立,;且与相互独立,则称则称 F=(X/m)/(Y/n)服从第一自由度为服从第一自由度为m,第二自由度为,第二自由度为n 的的 F 分布。记成分布。记成 F Fm,n。F 分布的概率分布的概率密度为密度为F 分布分布的概率的概率密度图形密度图形F1,3F3,3F5,3F7,3F3,3F3,4F3,5F3,7 若若 FFm,n,对给定的,对给定的 (0,1),(0,1),称满足条件

18、称满足条件F 分布的分位点分布的分位点的点的点 Fm,n()为为F分布的上分布的上 分位点。分位点。.F 分布上分布上 分位点有表分位点有表可查,见附表可查,见附表5 5。Fm,n()Fm,n(x)x F 分布上分布上 分位点分位点示意图示意图 一个需要注意的问题一个需要注意的问题:这个关系式的证明如下:这个关系式的证明如下:证明:证明:若若 X Fm,n,则,则 Y=X-1-1 Fn,m。依分位点定义,。依分位点定义,上式等价于上式等价于再根据再根据 Y(Fn,m)的上的上 分位点定分位点定义义,有有 在通常在通常 F 分布表中,只对分布表中,只对 比较小的值较小的值,如如 =0.01,0.

19、05,0.025及及0.1等列出了分位点。但有时我们也需要知等列出了分位点。但有时我们也需要知道道 比较较大大的的分位点,分位点,它们在它们在 F 分布表中查不到。这时我们就可利用分位点分布表中查不到。这时我们就可利用分位点的关系式的关系式(1)把它们计算出来。把它们计算出来。例如:对例如:对m=12,n=9,=0.95,我我们们在在 F 分布表中分布表中查查不到不到 F12,9(0.95),但由,但由(1)式,知式,知可从可从F 分布分布 表中查到表中查到 还有一个重要结果还有一个重要结果:若若X tn,则则X2 2 F1,n。请同学们自己证明。请同学们自己证明。定理定理 1:6.4.4 正

20、态总体样本均值与样本方差的分布正态总体样本均值与样本方差的分布例例1:设设某某物物体体的的实实际际重重量量为为(未未知知),),现现在在用用一一台台天天平平称量它称量它,共称共称 n 次次,得到得到X1 1,X2 2,Xn n。假假设设每每次次称称量量过过程程彼彼此此独独立立,且且无无系系统统误误差差,则则可可认认为为这这些些测测量量值值独独立立同同分分布布,均均服服从从正正态态分分布布N(,2 2),方方差差 2 2反反映映了了天天平平及及测测量量过过程程的的总总精精度度。我我们们通通常常用用样本均值样本均值根据定理根据定理1 1(基本定理基本定理),),有有再根据正态分布的性质再根据正态分

21、布的性质(见见p110,p110,例例4.2.6),),知知例如:例如:当当 =0.1 时,时,若取若取 n=10,则,则若取若取 n=100,则,则也就是说:我们的估计值也就是说:我们的估计值X 与真值与真值 的的偏差不超过偏差不超过3 3/n的概率约为的概率约为 99.7499.74%,并且并且随称量次数随称量次数 n 的增加,的增加,偏差界限偏差界限3/3/n将越来越小。将越来越小。例例2:在设计导弹发射装置时,重要内容之一是研究弹在设计导弹发射装置时,重要内容之一是研究弹着点偏离目标中心的距离的方差。着点偏离目标中心的距离的方差。对于某类导弹发射装置,弹着点偏离目标中心的距离服对于某类导弹发射装置,弹着点偏离目标中心的距离服从从 N(,2 2),这里,这里 2=100米米2 2。现在进行了现在进行了25次发射试验,用次发射试验,用 S2 2 记这记这25次试验中弹着点次试验中弹着点偏离目标中心的距离的样本方差。偏离目标中心的距离的样本方差。求求:S S 2 2 超过超过50米米2 2的概率。的概率。解解:根据基本定理,知根据基本定理,知查附表查附表4,4,得到得到:所以,所以,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁