《抽样与参数估计最新课件.ppt》由会员分享,可在线阅读,更多相关《抽样与参数估计最新课件.ppt(116页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样与参数估计最新第1页,此课件共116页哦第 5 章 抽样与参数估计5.1 抽样及其分布5.2 点估计5.3 单个总体参数的区间估计5.4 两个总体参数的区间估计附录:Excel的应用第2页,此课件共116页哦学习目标1 了解抽样和抽样分布的基本概念2 了解点估计的概念和估计量的优良标准3 掌握总体均值、总体比例和总体方差的区间估计4.掌握样本容量的确定5.掌握Excel的应用第3页,此课件共116页哦5.1 抽样及其分布1.抽样推断抽样推断2几个基本概念几个基本概念 总体个体总体个体 样本样本 统计量统计量 抽样单元与抽样框抽样单元与抽样框3.抽样组织方式抽样组织方式4 抽样分布抽样分布第
2、4页,此课件共116页哦抽样推断的概念抽样推断是指根据随机原则,从总体中抽取一部分单位进行观察,并依据所获得数据的处理结果,对总体的数量特征做出具有一定可靠程度的估计和判断,从而达到对总体的分布状况及其数量特征认识的目的。第5页,此课件共116页哦抽样推断的类型参数估计:根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。假设检验:根据样本信息对研究总体的数量规律是否具有某种指定特征进行检验。第6页,此课件共116页哦抽样推断的应用场合(1)用于无法采用或不必采用全面调查的 现象;(2)对全面调查的结果进行复核;(3)生产过程的质量控制;(4)对总体的假设进行检验。第7页,此课件共116
3、页哦总体和个体(概念要点)1具体含义 总体(Population):调查研究的事物或现象的全体。例如:全部居民、所有产品 个体(Item unit):组成总体的每个元素2抽象含义 总体(Population):调查研究中所关心的作为随机变量的统计指标。例如居民收入、产品寿命 个体(Item unit):统计指标所取得每个可能值第8页,此课件共116页哦样本(Sample)1样本(Sample):从总体中所抽取的部分个体2样本容量(Sample size):样本中所含个体的数量3样本选取的基本原则:代表性:样本的每个分量都与总体有相同的分布 独立性:样本的每个分量都是相互独立的。即要求观察结果之
4、间互不影响。4简单随机样本:满足代表性和独立性的样本5简单随机抽样:获得简单随机样本的方法第9页,此课件共116页哦一次失败的统计调查一次失败的统计调查在在1936年的美国总统选举前,一份名为年的美国总统选举前,一份名为 Literary Digest 的杂志进的杂志进行了一次民意调查。调查的焦点是谁将成为下一届总统行了一次民意调查。调查的焦点是谁将成为下一届总统的的挑战者,是堪萨斯州州长挑战者,是堪萨斯州州长Alf Landon,还是现任总统,还是现任总统 Franklin Delano Roosevelt。为了解选民意向,民意调查专家们根据电。为了解选民意向,民意调查专家们根据电话簿和车辆
5、登记簿上的名单给一大批人发了简单的调查表(电话簿和车辆登记簿上的名单给一大批人发了简单的调查表(电话和汽车在话和汽车在1936年并不像现在那样普及,但是这些名单比较容易得年并不像现在那样普及,但是这些名单比较容易得到)。尽管发出的调查表大约有一千万张,但收回的比例并不高。在到)。尽管发出的调查表大约有一千万张,但收回的比例并不高。在收回的调查表中,收回的调查表中,Alf Landon非常受欢迎。于是该杂志预测非常受欢迎。于是该杂志预测 Landon 将赢得选举。但事实上是将赢得选举。但事实上是Franklin Roosevelt赢得了这次赢得了这次选举选举第10页,此课件共116页哦失败的原因
6、在经济大萧条时期调查有电话和汽车的在经济大萧条时期调查有电话和汽车的人们,并不能够反映全体选民的观点。人们,并不能够反映全体选民的观点。此外,只有少数的问卷被收回。这些都此外,只有少数的问卷被收回。这些都是值得怀疑的是值得怀疑的第11页,此课件共116页哦抽样单元与抽样框1.抽样单元(Sampling unit):将总体划分成互不重迭且又穷尽的若干部分,每个部分称为一个抽样单元每每个抽样单元都是由若干个体组成的集合个抽样单元都是由若干个体组成的集合只由一个个体组成就称为最小抽样单元只由一个个体组成就称为最小抽样单元 抽样单元可以是自然形成的,也可以是人为划定的抽样单元可以是自然形成的,也可以是
7、人为划定的 2.抽样框(Sampling frame):关于抽样单元的名册或清单上一级别的某个抽样单元被抽中,必须在下一级别抽样框中连续抽样上一级别的某个抽样单元被抽中,必须在下一级别抽样框中连续抽样有效的抽样框所包含的抽样单元应既无遗漏又无重复有效的抽样框所包含的抽样单元应既无遗漏又无重复第12页,此课件共116页哦参数与统计量例:设 是总体 容量为n的样本,则样本均值(Sample mean):样本方差(Sample variance):阶原点矩(Moment of order ):都是统计量统计量是不含任何未知参数的样本函数。由样本构造统计量,统计量是不含任何未知参数的样本函数。由样本构
8、造统计量,实际上是对样本所含实际上是对样本所含总体总体的信息提炼加工;根据不同的推断要求,的信息提炼加工;根据不同的推断要求,可以构造不同的统计量。可以构造不同的统计量。第13页,此课件共116页哦抽样组织方式 第14页,此课件共116页哦抽样组织方式第15页,此课件共116页哦概率抽样(probability sampling)1.也称随机抽样也称随机抽样2.特点特点:n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本l抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中n每每个个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以以计计算
9、算出来的出来的 n当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到到每每个个样样本单位被抽中的概率本单位被抽中的概率第16页,此课件共116页哦简单随机抽样(simple random sampling)1.从从总总体体N个个单单位位中中随随机机地地抽抽取取n个个单单位位作作为为样样本本,使使得得每每一个容量为样本都有相同的机会一个容量为样本都有相同的机会(概率概率)被抽中被抽中.2.特点特点n简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便 是最基
10、本的抽样方法,并且是其它抽样方法的基础是最基本的抽样方法,并且是其它抽样方法的基础3.局限性n当当N很大时,不易构造抽样框很大时,不易构造抽样框n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率第17页,此课件共116页哦抽样方法抽取元素的具体方法有重复抽样和不重复抽样(1)重复抽样(有放回的抽样)重复抽样(有放回的抽样)是从N个总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个单位,这样连续抽取n个单位组成样本的方法。(2)不重复抽样(无放回抽样)不重复抽样(无放回抽样)
11、是从N个总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取n个单位组成样本的方法。根据对样本的要求不同,又分考虑顺序的抽样和不考虑顺序的抽样抽样方法的不同抽样方法的不同,获得样本的可能数目也不同获得样本的可能数目也不同.第18页,此课件共116页哦样本的可能数目(1)考虑顺序的不重复抽样,样本的可能数目为:(2)考虑顺序的重复抽样,样本的可能数目为:(3)不考虑顺序的不重复抽样,样本的可能数目为:(4)不考虑顺序的重复抽样,样本的可能数目为:第19页,此课件共116页哦分层抽样(分类抽样、类型抽样)(stratified sampling)1.将抽
12、样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本.2.优点:n保证样本的结构与总体的结构比较相近,从而提高估计的精度n组织实施调查方便n既可以对总体参数进行估计,也可以对各层的目标量进行估计第20页,此课件共116页哦系统抽样(机械抽样、等距抽样)(systematic sampling)1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位.n先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的
13、估计比较困难第21页,此课件共116页哦整群抽样(cluster sampling)1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查.2.特点:n抽样时只需群的抽样框,可简化工作量n调查的地点相对集中,节省调查费用,方便调查的实施.n缺点是估计的精度较差.第22页,此课件共116页哦二阶抽样与多阶段抽样(two&multi-stage sampling)1.先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查n群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样2.
14、不需要对每个高级别的抽样单元建立关于低级别抽样单元的抽样框,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,经常被采用的方法 第23页,此课件共116页哦抽样分布第24页,此课件共116页哦抽样分布(sampling distribution)1.样本统计量的概率分布,是一种理论分布n在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.样本统计量样本统计量是随机变量是随机变量n样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,
15、是进行推断的理论基础,也是抽样推断科学性的重要依据 第25页,此课件共116页哦抽样分布的形成过程(sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本第26页,此课件共116页哦样本均值的抽样分布第27页,此课件共116页哦样本均值的抽样分布1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础第28页,此课件共116页哦样本均值的抽样分布(例题分析)【例例例例】设
16、设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总总体体的的均均值值、方差及分布如下方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差第29页,此课件共116页哦样本均值的抽样分布(例题分析)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124
17、,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)第30页,此课件共116页哦样本均值的抽样分布(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30
18、.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5第31页,此课件共116页哦样本均值的分布与总体分布的比较(例题分析)=2.5=2.5 2 2=1.25=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x第32页,此课件共116页哦样本均值的抽样分布与中心极限定理 =50=50 =10=10X X总体分布总体分布n n=4=4抽样分布抽样分布xn n=16
19、=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期期望望为为,方差为方差为 2 2/n n。即。即 x xN N(,2 2/n n)第33页,此课件共116页哦中心极限定理(central limit theorem)当样本容量足够大时(n 30),样本均值的抽样分布逐渐趋于正态分布中中心心极极限限定定理理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个任意分布
20、的总体x x第34页,此课件共116页哦中心极限定理(central limit theorem)x 的分布趋于正态分布的过程第35页,此课件共116页哦抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布第36页,此课件共116页哦1.样本均值的数学期望2.样本均值的方差n重复抽样n不重复抽样样本均值的抽样分布(数学期望与方差)第37页,此课件共116页哦样本均值的抽样分布(数学期望与方差)比较及结论:比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/
21、n第38页,此课件共116页哦样本比例的抽样分布第39页,此课件共116页哦1.总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为 比例(proportion)第40页,此课件共116页哦1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似 4.推断总体比例的理论基础样本比例的抽样分布第41页,此课件共116页哦1.样本比例的数学期望2.样本比例的方差n重复抽样n不重复抽样样本比例的抽样分
22、布(数学期望与方差)第42页,此课件共116页哦5.2 点估计点估计的常用方法衡量估计量的标准第43页,此课件共116页哦参数估计概述第44页,此课件共116页哦参数估计概述1.统计估计:研究由样本估计总体的未知分布或 分布中的未知参数2.非参数估计:直接对总体未知分布的估计3.参数估计:总体分布类型已知,仅需对分布的 未知参数进行的估计第45页,此课件共116页哦参数估计的基本方法第46页,此课件共116页哦参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计
23、方方 法法点点 估估 计计区间估计区间估计第47页,此课件共116页哦1.估计量:用于估计总体参数的随机变量n如样本均值,样本比例、样本方差等n例如:样本均值就是总体均值 的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值 x=80,则80就是的估计值估计量与估计值(estimator&estimated value)第48页,此课件共116页哦点估计(point estimate)1.点估计量:设总体 的分布类型已知,但包含未知参数,从总体中抽取一个简单随机样本 ,构造一个适当的统计量 作为的估计,称 为未知参数的点估计量 2.用样本的估
24、计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估例如:用两个样本均值之差直接作为总体均值之差的估计3.没有给出估计值接近总体未知参数程度的信息第49页,此课件共116页哦点估计的常用方法(一)矩法估计 用总体矩对应的样本矩作为其点估计量。(二)极大似然估计 第50页,此课件共116页哦评价估计量的标准第51页,此课件共116页哦无偏性(unbiasedness)P P()BA无偏无偏无偏无偏有偏有偏有偏有偏设设是未知参数是未知参数 的一个点估计量,若的一个点估计量,若满足满足则称则称是是 的无偏估计量,否则称为有偏估计量的无偏估计量,否则称为有偏估计量第52页,此课件共116页
25、哦有效性(efficiency)有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布 的抽样分布P()第53页,此课件共116页哦一致性(consistency)一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P()第54页,此课件共116页哦均方误差准则(Mean square error)是参数是参数 的两个估计量,若对的两个估计量,若对 的一切可能值,的一切可能值,设设且严格不等式至少对参数且严格不等式至少对参数 的某个可能值成立,的某个可能值成立,则称在均方误则称在均方误优于优于,差意义下差意
26、义下注:均方误差准则计量取值注:均方误差准则计量取值“集中集中”于参数真值得的程度于参数真值得的程度第55页,此课件共116页哦5.3 单个总体参数的区间估计1.总体均值的区间估计2.总体比例的区间估计3.总体方差的区间估计第56页,此课件共116页哦区间估计(interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区
27、间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限第57页,此课件共116页哦置信区间(confidence interval)1.设是未知参数,是来自总体的样本,构造两个统计量 ,对于给定的(0 1,若、满足:则称随机区间则称随机区间是参数是参数 置信水平为置信水平为(1-(1-的置信区间,的置信区间,(1-(1-称为称为的置信系数,的置信系数,、称为置信限。称为置信限。第58页,此课件共116页哦1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平.(样本的估计值接近于总体参数的概率)2.表示为(1-n 为是总体参
28、数未在区间内的比例3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平 第59页,此课件共116页哦2.区间宽度为随机变量,置信区间为随机区间3.置信水平描述了估计的可靠度,区间宽度描述 了估计的精度 4.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间与置信水平 第60页,此课件共116页哦置信区间与置信水平 均值的抽样分布(1-)%区间包含了区间包含了%的区间未包含的区间未包
29、含 1 1 /2 2 /2 2第61页,此课件共116页哦影响区间宽度的因素1.总体数据的离散程度,用来测度2.样本容量,3.置信水平(1-),影响 z 的大小第62页,此课件共116页哦总体均值区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第63页,此课件共116页哦总体均值的区间估计第64页,此课件共116页哦总体均值的区间估计(正态总
30、体且正态总体且 已知或非正态总体、已知或非正态总体、未知、大样本未知、大样本)1.假定条件n总体服从正态分布,且方差()已知n如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z3.3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为第65页,此课件共116页哦总体均值的区间估计(例题分析)【例例例例 5.3.15.3.1】保保险险公公司司从从投投保保人人中中随随机机抽抽取取3636人人,计计算算得得3636人人的的平平均均年年龄龄 岁岁,已已知知投投保保人人平平均均年年龄龄近近似似服服从从正正态态分分布布,标标准准差差为为7.27.2岁,试求全
31、体投保人平均年龄的置信水平为岁,试求全体投保人平均年龄的置信水平为99%99%的置信区间的置信区间 解解解解:已已知知n n=36,=36,1-1-=99%99%,z z/2/2=2.575=2.575。根根据据样样本本数数据据计计算算得得:总总体均值体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为故故全全体体投投保保人人平平均均年年龄龄的的置置信信水水平平为为99%99%的的置置信信区区间间为为36.4136.41,52.5952.59第66页,此课件共116页哦总体均值的区间估计(例题分析)【例例例例5.3.2 5.3.2】一一家家食食品品公公司司,每每天天大大约约生生产产
32、袋袋装装食食品品若若干干,按按规规定定每每袋袋的的重重量量应应为为100g100g。为为对对产产品品质质量量进进行行检检测测,该该企企业业质质检检部部门门采采用用抽抽样样技技术术,每每天天抽抽取取一一定定数数量量的的食食品品,以以分分析析每每袋袋重重量量是是否否符符合合质质量量要要求求。现现从从某某一一天天生生产产的的一一批批食食品品80008000袋袋中中随随机机抽抽取取了了2525袋袋(不不重重复复抽抽样样),测测得得它它们们的的重重量量如如下下表表所所示示,已已知知产产品品重重量量服服从从正正态态分分布布,且且总总体体方方差差为为100g100g。试试估估计计该该批批产产品平均重量的置信
33、区间,置信水平为品平均重量的置信区间,置信水平为9595。25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第67页,此课件共116页哦总体均值的区间估计(例题分析)解解解解:已已知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z/2/2=1.96=1.96。根根据据样样本本数据计算得:数据计算得:总体均值总体均值 在在1-1-置信
34、水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.4459g109.2741g101.4459g109.2741g注:在不重复抽样条件下,置信区间取注:在不重复抽样条件下,置信区间取第68页,此课件共116页哦总体均值的区间估计(例题分析)【例例例例5.3.35.3.3】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试试建建立立投保人年龄投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 2
35、33539273644364246433133425345544724342839364440394938344850343945484532第69页,此课件共116页哦总体均值的区间估计(例题分析)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据据计计算算得得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁第70页,此课件共116页哦总体均值的区间估计(正态总体、方差未知、小样本)1.假
36、定条件n总体服从正态分布,且方差()未知n小样本(n 30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为第71页,此课件共116页哦t 分布 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z第72页,此课件共116页哦总体均值的区间估计(例
37、题分析)【例例例例5.3.45.3.4】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下下。建建立立该该批批灯灯泡泡平平均均使使用寿命用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第73页,此课件共116页哦总体均值的区间估计(例题分析)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95
38、%=95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时第74页,此课件共116页哦总体比例的区间估计第75页,此课件共116页哦总体比例的区间估计1.假定条件:大样本条件下,样本比例的抽样分布可以由正态分 布来近似2.使用正态分布统计量 z3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区
39、间为第76页,此课件共116页哦总体比例的区间估计(例题分析)【例例例例5.3.55.3.5】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试 以以 95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比例的置信区间比例的置信区间解解:已知 n=100,p65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%74.35%第77页,此课件共116页哦总体比例的区间估计(例题分析)【例例例例 5.3.65.
40、3.6】某某企企业业共共有有职职工工10001000人人,企企业业准准备备实实行行一一项项改改革革,在在职职工工中中征征求求意意见见,采采用用不不重重复复抽抽样样方方法法,随随机机抽抽取取200200人人作作为为样样本本,调调查查结结果果显显示示,由由150150人人表表示示赞赞成成这这项项改改革革,有有5050人人表表示示反反对对。试试以以9595的的置置信信水水平平确确定定赞赞成成改改革革的的人人数数比比例例的的置置信信区间区间 解解解解:已已知知n n=200,=200,z z/2/2=1.96=1.96,p p75%75%。根根据据样样本本数数据据计计算算得得总总体体均值均值 在在1-
41、1-置信水平下的置信区间为置信水平下的置信区间为95的置信水平下估计赞成改革的人数比例的置信区间为69.63%80.37%第78页,此课件共116页哦总体方差的区间估计第79页,此课件共116页哦总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 的点估计量为S2,且4.4.总体方差在1-1-置信水平下的置信区间为第80页,此课件共116页哦总体方差的区间估计(图示)1-1-总体方差总体方差1-1-的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 第81页,此课件共116页哦总体方差的区间估计(例题分析)【例例例例5.3.75.3
42、.7】食食品品厂厂从从生生产产的的罐罐头头中中随随机机抽抽取取1515个个称称量量其其重重量量,得得样样本本方方差差s s2 2=1.651.652 2(克克2 2),设设罐罐头头重重量量服服从从正正态态分分布布,试试求求其其方方差差的置信水平为的置信水平为90%90%的置信区间。的置信区间。解解解解:已知已知n n1515,1-1-90%,90%,s s2 2=1.651.652 2 查卡方分布表的:查卡方分布表的:故总体方差的置信水平为故总体方差的置信水平为90%90%的置信区间为的置信区间为1.611.61,5.85.8 第82页,此课件共116页哦 5.4 两个总体参数的区间估计1.总
43、体均值之差的区间估计2.总体比例之差的区间估计3.总体方差之比的区间估计第83页,此课件共116页哦两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比率之差方差比第84页,此课件共116页哦两个总体均值之差的区间估计(独立大样本)第85页,此课件共116页哦两个总体均值之差的估计(大样本)1.假定条件n两个总体都服从正态分布,1、2已知n若不是正态分布,可以用正态分布来近似(n130和n230)n两个样本是独立的随机样本2.使用正态分布统计量 z第86页,此课件共116页哦两个总体均值之差的估计(大样本)1.1,2已知时,两个总体均值之差1-2在1-置信水平下
44、的置信区间为2.2.1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置置信水平下的置信区间为信水平下的置信区间为第87页,此课件共116页哦两个总体均值之差的估计(例题分析)【例例例例】某某地地区区教教育育委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表 。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的置信区间的置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学
45、2n1=46n1=33S1=5.8 S2=7.2第88页,此课件共116页哦两个总体均值之差的估计(例题分析)解解解解:两个总体均值之差在两个总体均值之差在两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分分分10.9710.97分分分分第89页,此课件共116页哦两个总体均值之差的区间估计(独立小样本)第90页,此课件共116页哦两个
46、总体均值之差的估计(小样本:12=22)1.假定条件n两个总体都服从正态分布n两个总体方差未知但相等:1=2n两个独立的小样本(n130和n230)2.总体方差的合并估计量3.3.估计估计量量 x x1 1-x x2 2的抽样标准差的抽样标准差第91页,此课件共116页哦两个总体均值之差的估计(小样本:12=22)1.两个样本均值之差的标准化2.2.两个总体均值之差两个总体均值之差两个总体均值之差两个总体均值之差 1-2 2在在在在1-1-置信水平下的置信区置信水平下的置信区置信水平下的置信区置信水平下的置信区间为间为间为间为第92页,此课件共116页哦两个总体均值之差的估计(例题分析)【例例
47、例例】为为为为估估估估计计计计两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品所所所所需需需需时时时时间间间间的的的的差差差差异异异异,分分分分别别别别对对对对两两两两种种种种不不不不同同同同的的的的组组组组装装装装方方方方法法法法各各各各随随随随机机机机安安安安排排排排1212名名名名工工工工人人人人,每每每每个个个个工工工工人人人人组组组组装装装装一一一一件件件件产产产产品品品品所所所所需需需需的的的的时时时时间间间间(分分分分钟钟钟钟)下下下下如如如如表表表表。假假假假定定定定两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品的的的的时时时时间间间间服服服服
48、从从从从正正正正态态态态分分分分布布布布,且且且且方方方方差差差差相相相相等等等等。试试试试以以以以95%95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.
49、52 21 1第93页,此课件共116页哦两个总体均值之差的估计(例题分析)解解解解:根据样本数据计算得根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟第94页,此课件共116页哦两个总体均值之差的估计(小样本:12 22)1.假定条件n两个总体都服从正态分布n两个总体方差未知且不相等:12n两个独立的小样本(n130和n230)2.使用统计量第95页,此课件共116页哦两个总体均值之差的估计(小样本:1222)两个总体均值之差1-2在1-置信水平下的置信区间
50、为自由度自由度第96页,此课件共116页哦两个总体均值之差的估计(例题分析)【例例例例】沿沿沿沿用用用用前前前前例例例例。假假假假定定定定第第第第一一一一种种种种方方方方法法法法随随随随机机机机安安安安排排排排1212名名名名工工工工人人人人,第第第第二二二二种种种种方方方方法法法法随随随随机机机机安安安安排排排排名名名名工工工工人人人人,即即即即n n1 1=12=12,n n2 2=8=8,所所所所得得得得的的的的有有有有关关关关数数数数据据据据如如如如表表表表。假假假假定定定定两两两两种种种种方方方方法法法法组组组组装装装装产产产产品品品品的的的的时时时时间间间间服服服服从从从从正正正正