《第四章抽样分布最新优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章抽样分布最新优秀PPT.ppt(105页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章抽样分布最新第四章抽样分布最新第一页,本课件共有105页统计推断的过程统计推断的过程样样样样本本本本总总体体样本统计样本统计量量例如:样本例如:样本均值、比例、均值、比例、方差方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差例、方差例、方差例、方差2第二页,本课件共有105页 学习目标学习目标n1.理解概率及概率分布的意义;理解概率及概率分布的意义;n2.掌握抽样的基本概念以及抽样分布的概念;掌握抽样的基本概念以及抽样分布的概念;n3.掌握总体参数点估计的基本方法及其优良掌握总体参数点估计的基本方法及其优良 标准;标准;n4.掌握总体均值和成数指标的估计方法;掌握总体均值和成
2、数指标的估计方法;n5.了解抽样设计的基本内容。了解抽样设计的基本内容。3第三页,本课件共有105页 第一节第一节 频率、概率与概率分布频率、概率与概率分布n(Omitted)4第四页,本课件共有105页 第二节第二节 抽样分布抽样分布 一、抽样的基本概念一、抽样的基本概念 抽样涉及的基本概念有:抽样涉及的基本概念有:1.总体与样本总体与样本(在第一章在第一章)2.样本容量与样本个数样本容量与样本个数 3.总体参数与样本统计量总体参数与样本统计量 这些概念是统计学特有的,体现了统计学的基这些概念是统计学特有的,体现了统计学的基本思想与方法。本思想与方法。5第五页,本课件共有105页(一)样本容
3、量与样本个数(一)样本容量与样本个数 1.样本容量:样本容量:样本是从总体中抽出的部分单位的集合,这个集样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,它表明一个样本中所包含的合的大小称为样本容量,它表明一个样本中所包含的单位数。单位数。一般地说,样本容量大,抽样误差会小,但调查一般地说,样本容量大,抽样误差会小,但调查费用会增加,反之,样本容量过小,又将导致抽样误费用会增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。因此,在抽样设差增大,甚至失去抽样推断的价值。因此,在抽样设计中应根据调查目的和要求认真考虑合适的样本容量。计中应根据调查目的和要求认真考
4、虑合适的样本容量。6第六页,本课件共有105页2.样本个数:样本个数:样样本本个个数数又又称称样样本本可可能能数数目目,它它是是指指从从一一个个总总体体中中可可能能抽抽取取多多少少个个样样本本。样本个数的多少与抽样方法有关。关于样本个数的计算我们将在“重复抽样与不重复抽样”中介绍。注意:注意:这这个个概概念念只只是是对对有有限限总总体体有有意意义义,对对无无限限总体没有意义!总体没有意义!7第七页,本课件共有105页(二)总体参数与样本统计量(二)总体参数与样本统计量1.总体参数:总体参数:总总体体分分布布的的参参数数往往往往是是总总体体的的数数量量特特征征,也是统计推断的对象。也是统计推断的
5、对象。常常见见的的总总体体参参数数有有:总总体体平平均均数数指指标标,总总体体成成数数(比比率率)指指标标,总总体体分分布布的的方方差差、标标准准差差,等等等等。它它们们都都是是反反映映总总体体分分布布特特征征的的重重要要指指标标。总总体体成成数数(也也称称总总体体比比率率)指指标标是是指指总总体体中中具具有有某某性性质质的的单单位位数数目目在在总总体体中中所所占的比重,它反映了总体的结构特征。占的比重,它反映了总体的结构特征。8第八页,本课件共有105页2.样本统计量:样本统计量:通通俗俗地地说说,样样本本统统计计量量是是样样本本的的函函数数。由由于于样样本本是是从从总总体体中中随随机机地地
6、抽抽出出来来的的,因因此此,样样本本统统计计量量也也是是随随机机变变量量。我我们们利利用用样样本本统统计计量量来来估估计计或或推推断断总总体体的的参参数数和和数数量量特特征征。设已有样本设已有样本 ,常见的统计量有:,常见的统计量有:样本平均数样本平均数 9第九页,本课件共有105页10第十页,本课件共有105页(三)重复抽样与不重复抽样(三)重复抽样与不重复抽样1.1.重重复复抽抽样样:重重复复抽抽样样(或或重重置置抽抽样样)是是指指从从总总体体中中抽抽出出一一个个样样本本单单位位,记记录录其其标标志志值值后后,又将其放回总体中继续参加下一轮又将其放回总体中继续参加下一轮抽样抽样。重重复复抽
7、抽样样的的特特点点是是:第第一一,n n个个单单位位构构成成的的样样本本是是n n次次试试验验的的结结果果。第第二二,每每次次试试验验是是独独立立的的,即即其其试试验验的的结结果果与与前前次次、后后次次的的结结果果无无关关。第第三三,每每次次试试验验是是在在相相同同条条件件下下进进行行的的,每每个个单单位位在在每每次次试试验验中中选选中中的的机机会会(概概率率)是是相相同同的的。在在重重复复试试验验中中,样样本本可可能能的的个个数是数是Nn,N N为总体单位数,为总体单位数,n n为样本容量。为样本容量。11第十一页,本课件共有105页2.不不重重复复抽抽样样:不不重重复复抽抽样样亦亦称称为为
8、不不重重置置抽抽样样,即即每每次次从从总总体体抽抽取取一一个个单单位位,登登记记后后不不放放回回原原总总体体,不不参参加加下下一一轮轮抽抽样样。下下一一次次继继续续从从总总体体中中余余下下的的单单位位抽取样本。抽取样本。其其特特点点是是:n个个单单位位的的样样本本由由 n 次次试试验验结结果果构构成成,但但由由于于每每次次抽抽出出不不重重复复,所所以以实实质质上上相相当当于于从从总总体体中中同同时时抽抽取取n个个样样本本单单位位。如如果果考考虑虑顺顺序序,其其样样本本可可能能个个数为数为 ;如果不考虑顺序,其样本可能个数为;如果不考虑顺序,其样本可能个数为 12第十二页,本课件共有105页 二
9、、抽样分布二、抽样分布(一一)重复抽样分布重复抽样分布13第十三页,本课件共有105页 所以,由概率论知,如果总体是正态分布的,所以,由概率论知,如果总体是正态分布的,则则样本平均数的抽样分布是如下样本平均数的抽样分布是如下正态分布正态分布这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。14第十四页,本课件共有105页 某班组某班组5个工人的日工资个工人的日工资为为34、38、42、46、50元。元。现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有52=25个样本。个样本。例例 子子15第十五页,本课件共有105页 此
10、指标反映所有的样本平此指标反映所有的样本平均数与总体平均数的平均误差,均数与总体平均数的平均误差,称为称为抽样平均误差抽样平均误差,用,用 表表示。示。n得出两个结论得出两个结论16第十六页,本课件共有105页2.2.总体成数的估计总体成数的估计样本成数分布的性质:样本成数分布的性质:总总体体成成数数p是是指指具具有有某某种种特特征征的的单单位位在在总总体体中中的的比比重重。在在前前面面我我们们已已经经知知道道,成成数数是是一一个个特特殊殊平平均均数数,设设总总体体单单位位总总数数目目是是N,总总体体中有该特征的单位数是中有该特征的单位数是N N1 1。设。设X是是0、1变量,变量,即:总体单
11、位有该特征,则即:总体单位有该特征,则X取取1,否则取,否则取0,则有:,则有:现现从从总总体体中中抽抽出出n n个个单单位位,如如果果其其中中有有相相应应特特征征的的单单位位数数是是n n1 1,则则样本成数是:样本成数是:17第十七页,本课件共有105页 P也也是是一一个个随随机机变变量量,利利用用样样本本平平均均数数的的分分布布性性质质结论,即有:结论,即有:E(P)=p18第十八页,本课件共有105页(二二)不重置抽样分布不重置抽样分布1、样本平均数的分布、样本平均数的分布 某班组某班组5个工人的日工资个工人的日工资为为34、38、42、46、50元。元。现用不重置抽样的方法从现用不重
12、置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有20个样本。个样本。19第十九页,本课件共有105页20第二十页,本课件共有105页得出两个结论:得出两个结论:此指标反映所有的样本平均数与总体平均数此指标反映所有的样本平均数与总体平均数的平均误差,称为的平均误差,称为抽样平均误差抽样平均误差,用,用 表示。表示。21第二十一页,本课件共有105页2.样本成数的分布样本成数的分布 抽样平均误差为:抽样平均误差为:对于(对于(0,1)分布的总体,)分布的总体,总体平均数为:总体平均数为:总体方差为:总体方差为:从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样本
13、成数p的分布实质是的分布实质是样本平均数的分布。有:样本平均数的分布。有:22第二十二页,本课件共有105页三、大数定理与中心极限定理三、大数定理与中心极限定理(一一)大数定理大数定理 大大数数定定理理又又称称作作大大数数法法则则。人人们们在在观观察察个个别别事事物物时时,是是连连同同一一切切个个别别的的特特性性来来观观察察的的。个个别别现现象象受受偶偶然然因因素素影影响响,有有各各自自不不同同的的表表现现。但但是是,对对总总体体的的大大量量观观察察后后进进行行平平均均,就就能能使使偶偶然然因因素素的的影影响响相相互互抵抵消消,消消除除由由个个别别偶偶然然因因素素引引起起的的极极端端性性影影响
14、响,从从而而使使总总体体平平均均数数稳稳定定下下来来,反反映映出出事事物物变变化化的的一一般般规规律,这就是大数定理的意义。律,这就是大数定理的意义。23第二十三页,本课件共有105页24第二十四页,本课件共有105页25第二十五页,本课件共有105页 2.中心极限定理中心极限定理 26第二十六页,本课件共有105页第三节第三节 总体参数估计总体参数估计一、总体参数估计概述一、总体参数估计概述n总体参数估计就是以样本统计量来估计总体参总体参数估计就是以样本统计量来估计总体参数。数。n参数估计应满足以下两个要求:一是估计的精参数估计应满足以下两个要求:一是估计的精度要求,二是可靠性要求。所谓精度
15、就是估度要求,二是可靠性要求。所谓精度就是估计误差的最大范围,即误差的最大值,可通计误差的最大范围,即误差的最大值,可通过极限误差来反映;所谓可靠性是指估计结过极限误差来反映;所谓可靠性是指估计结果正确的概率大小。果正确的概率大小。27第二十七页,本课件共有105页28第二十八页,本课件共有105页参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计29第二十九页,本课件共有105页二、点二、点 估估 计计
16、第三十页,本课件共有105页(一一)点估计的定义点估计的定义 点估计就是根据总体参数与样本统计量之间的内在联点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计量。系,直接以样本统计量作为相应总体参数的估计量。在统在统计中经常使用的点估计量有:计中经常使用的点估计量有:31第三十一页,本课件共有105页 【例例4-9】对某企业的产品进行抽样检验,设对某企业的产品进行抽样检验,设 抽抽出出100件件产产品品,其其中中不不合合格格产产品品5件件,试试估估计计该该企企业业产品的合格率是多少?产品的合格率是多少?我我们们可可以以通通过过样样本本的的合合格格率率来来估
17、估计计企企业业产产品品的的合合格格率率。样样本本合合格格率率p=95/100=95%,我我们们估估计计该该企企业业产产品品的的合合格率是格率是95%。32第三十二页,本课件共有105页(二二)估计的评价标准估计的评价标准n点点估估计计的的优优点点是是直直接接给给出出了了总总体体参参数数的的估估计计值值。不不足之处是不能提供估计误差的信息。足之处是不能提供估计误差的信息。n样样本本统统计计量量是是一一个个随随机机变变量量,从从一一次次抽抽样样的的结结果果来来判判断断一一个个统统计计量量的的优优劣劣是是没没有有理理由由的的,必必须须通通过过多多次次试试验验或或从从抽抽样样分分布布的的特特点点出出发
18、发,才才能能判判断断这这个个估估计量是否为计量是否为优良优良的估计量。的估计量。n点点估估计计优优良良性性准准则则主主要要包包括括三三条条:无无偏偏性性、有效性有效性和和一致性一致性。33第三十三页,本课件共有105页1.无偏性无偏性 34第三十四页,本课件共有105页估计量的优良性准则估计量的优良性准则(无偏性)(无偏性)n无无偏偏性性:估估计计量量的的数数学学期期望望等等于于被被估估计计的的总总体参数体参数P P(X X)X XCA无无 偏偏有有有有 偏偏偏偏35第三十五页,本课件共有105页例:例:这就是为什么样本方差用这就是为什么样本方差用n-1的原因!的原因!36第三十六页,本课件共
19、有105页2.有效性有效性 37第三十七页,本课件共有105页估计量的优良性准则估计量的优良性准则(有效性)(有效性)AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)有效性:有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量38第三十八页,本课件共有105页3.一致性一致性 39第三十九页,本课件共有105页估计量的优良性准则估计量的优良性准则(一致性)(一致性)n一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量量越越来来
20、越接近被估计的总体参数越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X40第四十页,本课件共有105页三、区间估计三、区间估计第四十一页,本课件共有105页(一一)区间估计的含义区间估计的含义42第四十二页,本课件共有105页区间估计区间估计(概念要点)(概念要点)1.根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率3.例如例如:总体均值落在总体均值落在5070之间,置信度为之间,置
21、信度为 95%样本统计量样本统计量(点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限43第四十三页,本课件共有105页置信区间估计置信区间估计(内容)(内容)2 2 已知已知 2 2未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间44第四十四页,本课件共有105页落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX=Z x95%95%的样本的样本的样本的样本 -1.96 x +1.96 x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1
22、.65+1.65 x x45第四十五页,本课件共有105页1.总体未知参数落在区间内的概率总体未知参数落在区间内的概率2.表示为表示为(1-n 为显著性水平,是总体参数为显著性水平,是总体参数未在未在区间内区间内的概率的概率 3.常用的置信水平值有常用的置信水平值有 99%,95%,90%n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平(置信度置信度)46第四十六页,本课件共有105页区间与置信水平区间与置信水平 均值的抽样分布均值的抽样分布(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 1-1-/2 2 /2 247第四十七页,本课件共有
23、105页影响区间宽度影响区间宽度Z的因素的因素1.数据的离散程度,数据的离散程度,用用 来测度来测度2.样本容量,样本容量,3.置信水平置信水平(1-),影响,影响 Z 的大小的大小48第四十八页,本课件共有105页(二二)平均数的区间估计平均数的区间估计1.总体方差已知总体方差已知(已知已知):由由抽抽样样分分布布定定理理知知道道,如如果果总总体体服服从从正正态态分分布布,则则样样本本平平均均数数 ;如如果果总总体体正正态态性性不不成成立立,但但是是当当样样本本容容量量n充充分分大大时时,近似地也有近似地也有 因此,因此,49第四十九页,本课件共有105页50第五十页,本课件共有105页51
24、第五十一页,本课件共有105页52第五十二页,本课件共有105页53第五十三页,本课件共有105页54第五十四页,本课件共有105页2.总体方差未知总体方差未知55第五十五页,本课件共有105页56第五十六页,本课件共有105页第二步:根据给定的置信度第二步:根据给定的置信度90%,查,查t-分布概率表分布概率表得:得:第三步:计算允许误差第三步:计算允许误差57第五十七页,本课件共有105页58第五十八页,本课件共有105页(三三)成数指标的区间估计成数指标的区间估计59第五十九页,本课件共有105页例例 子子【例例4-12】某工厂要估计一批总数某工厂要估计一批总数5 000件的产品的废品率
25、,于件的产品的废品率,于是随机抽出是随机抽出400件产品进行检测,发现有件产品进行检测,发现有32件废品。试给出该批件废品。试给出该批产品的废品率的区间估计产品的废品率的区间估计(置信度是置信度是90%)。60第六十页,本课件共有105页1.总体平均数的区间估计总体平均数的区间估计第一,样本抽取后,用简单算术平均或加权平均的方第一,样本抽取后,用简单算术平均或加权平均的方法计算样本平均数法计算样本平均数 。第二,搜集总体数量标志方差的经验数据或计算样本第二,搜集总体数量标志方差的经验数据或计算样本数量标志方差数量标志方差S2。第三,计算抽样平均数的平均误差:第三,计算抽样平均数的平均误差:第四
26、,根据概率第四,根据概率F(Z)确定确定Z,计算平均数的极限误差,计算平均数的极限误差 。第五,总体平均数的置信区间。第五,总体平均数的置信区间。区间估计小结区间估计小结61第六十一页,本课件共有105页2.总体成数的区间估计总体成数的区间估计第一,样本抽取后,计算样本成数。第一,样本抽取后,计算样本成数。第二,用样本是非标志方差第二,用样本是非标志方差p(1-p)或经验数据代替或经验数据代替总体是非标志方差总体是非标志方差P(1-P)。第三,计算抽样成数的平均误差:第三,计算抽样成数的平均误差:第四,根据概率第四,根据概率F(Z)确定确定Z,计算平均数的极限误差,计算平均数的极限误差 。第五
27、,总体平均数第五,总体平均数P的置信区间。的置信区间。62第六十二页,本课件共有105页四、四、样本容量的确定样本容量的确定63第六十三页,本课件共有105页(一一)估计总体均值时样本容量的确定估计总体均值时样本容量的确定64第六十四页,本课件共有105页n【例例4-13】某企业想估计其职工上个月上下班花在路途上的平均某企业想估计其职工上个月上下班花在路途上的平均时间。经验表明,总体标准为时间。经验表明,总体标准为4.3分钟。以置信度分钟。以置信度95%的置信的置信区间进行估计,并使估计值处在真正平均值附近区间进行估计,并使估计值处在真正平均值附近1分钟的误分钟的误差范围之内。该企业应抽取多大
28、的样本?差范围之内。该企业应抽取多大的样本?n解:已知解:已知该企业至少应该抽取该企业至少应该抽取72名职工作为样本。名职工作为样本。65第六十五页,本课件共有105页66第六十六页,本课件共有105页(二二)估计成数时样本容量的确定估计成数时样本容量的确定67第六十七页,本课件共有105页(三三)使用上述公式应注意的问题使用上述公式应注意的问题n1.计算样本容量时,一般总体的方差与成数都是未计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代:一是用历史资料已有的知的,可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行方差与成数代替;二是在进行正式
29、抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体几次试验性调查,用试验中方差的最大值代替总体方差;三是成数方差在完全缺乏资料的情况下,就方差;三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值用成数方差的最大值0.25代替。代替。n2.如果进行一次抽样调查,同时估计总体均值与成数,如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个最用上面的公式同时计算出两个样本容量,可取一个最大的结果,同时满足两方面的需要。大的结果,同时满足两方面的需要。n3.上面的公式计算结果如果带小数,这时样本容量不按上面的公式计算结果如果带小数,这时样本容量不按四
30、舍五入法则取整数,取比这个数大的最小整数代替。四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:例如计算得到:n=56.03,那么,样本容量取,那么,样本容量取57,而,而不是不是56。68第六十八页,本课件共有105页69第六十九页,本课件共有105页70第七十页,本课件共有105页第四节第四节 抽样设计抽样设计(重点掌握概念重点掌握概念)抽抽样样估估计计效效果果好好坏坏,关关键键是是抽抽样样平平均均误误差差的的控控制制。抽抽样样平平均均误误差差小小,抽抽样样效效果果从从整整体体上上看就是好的;否则,抽样效果就不理想。看就是好的;否则,抽样效果就不理想。从从前前面面的的分分析析知
31、知道道,抽抽样样平平均均误误差差受受以以下下几几方方面面的的因因素素影影响响:一一是是总总体体的的变变异异性性,即即与与总总体体的的标标准准差差大大小小有有关关;二二是是样样本本容容量量;三三是是抽抽样样方方法法(重重置置与与不不重重置置)。还还有有一一个个重重要要的的因因素,就是抽样的组织形式。素,就是抽样的组织形式。71第七十一页,本课件共有105页n抽样的组织形式有:简单随机抽样、类型抽样、抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样等。不同抽等距抽样、整群抽样、阶段抽样等。不同抽样组织设计意味着对总体信息不同程度的利样组织设计意味着对总体信息不同程度的利用,意
32、味着不同的调查成本,它们之间抽样用,意味着不同的调查成本,它们之间抽样效果存在较大的差异。前面我们讨论的抽样效果存在较大的差异。前面我们讨论的抽样组织形式,都是简单随机抽样。接下来我们组织形式,都是简单随机抽样。接下来我们讨论其他几种抽样组织方式及其抽样平均误讨论其他几种抽样组织方式及其抽样平均误差。差。72第七十二页,本课件共有105页总方差、组间方差和组内方差(总方差、组间方差和组内方差(P75)n例子:某公司下属例子:某公司下属7个门市部某月营业额(单位:个门市部某月营业额(单位:万元)如下:万元)如下:88,90,96,98,110,140,200按营业额分两组:按营业额分两组:第一组
33、:第一组:88,90,96,98第二组:第二组:110,140,200根据上述资料可以计算根据上述资料可以计算:n总平均营业额:总平均营业额:n营业额的总方差:营业额的总方差:73第七十三页,本课件共有105页总方差、组间方差和组内方差总方差、组间方差和组内方差第一组:第一组:88,90,96,98第二组:第二组:110,140,200根据上述资料可以计算:根据上述资料可以计算:n第一组平均营业额:第一组平均营业额:n第一组营业额的组内方差:第一组营业额的组内方差:n第二组平均营业额:第二组平均营业额:n第二组营业额的组内方差:第二组营业额的组内方差:n组内方差的平均数:组内方差的平均数:74
34、第七十四页,本课件共有105页总方差、组间方差和组内方差总方差、组间方差和组内方差第一组平均营业额:第一组平均营业额:第二组平均营业额:第二组平均营业额:总平均营业额:总平均营业额:组间方差:组间方差:总方差总方差609.71795.671405.38总方差组内方差的平均数组间方差总方差组内方差的平均数组间方差75第七十五页,本课件共有105页一、一、类型抽样类型抽样(分层抽样分层抽样)它它是是按按一一定定标标志志对对总总体体各各单单位位进进行行分分类类,然然后后分分别别从从每每一一类类中按随机原则抽取一定的单位构成样本。中按随机原则抽取一定的单位构成样本。类类型型抽抽样样的的前前提提是是对对
35、总总体体的的结结构构有有着着一一定定的的了了解解,为为了了充充分分利利用用这这些些信信息息,提提高高估估计计的的精精确确性性,对对总总体体按按确确定定标标志志进进行行分分类类,保保证证抽抽出的样本与总体尽可能保持相似的结构。出的样本与总体尽可能保持相似的结构。例例如如,抽抽样样调调查查一一个个城城市市居居民民收收入入分分配配状状况况,如如果果历历史史资资料料反反映映了了该该城城市市居居民民的的贫贫富富结结构构:高高收收入入者者、中中等等收收入入者者与与低低收收入入者者的的比比例例结结构构,我我们们可可以以按按此此结结构构分分类类分分别别从从高高收收入入者者、中中等等收收入入者者与与低低收收入入
36、者者中中按按一一定定的的比比例例抽抽取取样样本本。这这样样就就可可以以避避免免样样本本全全来自某一收入阶层所产生的系统偏差。来自某一收入阶层所产生的系统偏差。76第七十六页,本课件共有105页77第七十七页,本课件共有105页78第七十八页,本课件共有105页79第七十九页,本课件共有105页80第八十页,本课件共有105页81第八十一页,本课件共有105页二、二、整群抽样整群抽样 整整群群抽抽样样就就是是将将总总体体各各单单位位分分成成若若干干群群,然然后后从从其其中中随随机机抽抽取取部部分分群群,对对中中选选的的群群进进行行全全面面调调查查的的抽抽样样组组织织方方式。式。在在总总体体单单位
37、位数数很很大大时时,如如果果直直接接从从总总体体中中抽抽取取总总体体单单位位,有有时时是是很很困困难难的的,比比如如从从一一个个大大城城市市中中的的所所有有大大学学生生中中抽抽样样了了解解大大学学生生的的基基本本情情况况,这这个个城城市市的的大大学学生生人人数数有有几几十十万万之之众众,直直接接抽抽取取样样本本单单位位有有许许多多困困难难。如如果果按按整整群群抽抽样样,以以班班级级为为抽抽样样单单位位,从从全全部部学学校校的的所所有有班班级级中中抽抽出出部部分分班班级级,调调查查抽中的班级,就方便多了。抽中的班级,就方便多了。82第八十二页,本课件共有105页83第八十三页,本课件共有105页
38、84第八十四页,本课件共有105页85第八十五页,本课件共有105页.86第八十六页,本课件共有105页.87第八十七页,本课件共有105页三、三、等距抽样等距抽样.88第八十八页,本课件共有105页89第八十九页,本课件共有105页 【例例4-17】某块麦地长某块麦地长300米,宽米,宽120米,包括米,包括120条垅,每垅长条垅,每垅长300米。现从这块麦地按等距抽样的方式,抽取米。现从这块麦地按等距抽样的方式,抽取50个个2米长米长垅为样本单位进行实割实测。样本距离为麦垅总长除以样本垅为样本单位进行实割实测。样本距离为麦垅总长除以样本单位数,即单位数,即300120/50=720(米米)
39、。现从地角一边样本距离之半处抽取第。现从地角一边样本距离之半处抽取第一个样本单位,即从一个样本单位,即从360米点前后各米点前后各1米为第一个样本单位,以后每米为第一个样本单位,以后每隔隔720米取一个样本单位,一直抽取出米取一个样本单位,一直抽取出50个样本单位为止。实个样本单位为止。实测各样本单位产量如测各样本单位产量如表表4-8-8。试计算平均亩产量的抽样平均误差,试计算平均亩产量的抽样平均误差,并以并以95%95%的概率保证估计这块麦地的亩产量和总产量。的概率保证估计这块麦地的亩产量和总产量。90第九十页,本课件共有105页91第九十一页,本课件共有105页92第九十二页,本课件共有1
40、05页93第九十三页,本课件共有105页四、四、阶段抽样阶段抽样94第九十四页,本课件共有105页95第九十五页,本课件共有105页96第九十六页,本课件共有105页97第九十七页,本课件共有105页98第九十八页,本课件共有105页。99第九十九页,本课件共有105页100第一百页,本课件共有105页101第一百零一页,本课件共有105页五、五、不同抽样组织设计的比较不同抽样组织设计的比较1.102第一百零二页,本课件共有105页2.类型抽样与整群抽样比较类型抽样与整群抽样比较 类类型型抽抽样样的的平平均均误误差差与与组组间间方方差差无无关关,决决定定于于组组内内方方差差的的平平均均水水平平
41、;整整群群抽抽样样的的平平均均误误差差与与组组内内方方差差无无关关,决决定定于于组组间间方方差差大大小小。总总体体方方差差等等于于组组间间方方差差加加上上组组内内方方差差平平均均数数。我我们们由由此此可可推推导导出出减减小小类类型型抽抽样样与与整整群群抽抽样样平均误差的方法。平均误差的方法。103第一百零三页,本课件共有105页(1)减减小小类类型型抽抽样样平平均均误误差差的的办办法法。提提高高组组间间方方差差,降降低低组组内内方方差差。具具体体来来说说,就就是是使使类类型型抽抽样样的的各各部部分分内内部部单单位位差差异异尽尽可可能能地地小小,不不同同类类型型间间的的差差异异尽尽可可能能地地大
42、大。如如果果组组间间方方差差接接近近于于总总体体方方差差,说说明明组组内内方方差差接接近近于于0,这这时时组组内内单单位位基基本本上上没没有有差差异异,这这是是一一种极端情况,类型抽样的平均误差接近于种极端情况,类型抽样的平均误差接近于0。(2)减减小小整整群群抽抽样样平平均均误误差差的的办办法法。为为了了降降低低抽抽样样平平均均误误差差,应应该该设设法法降降低低群群间间方方差差。可可通通过过提提高高群群内内方方差差方方法法达达到到降降低低群群间间方方差差目目的的。因因此此,类类型型抽抽样样与与整整群群抽抽样样对对总总体体进进行行分分组组的的要要求求刚刚好好是是相相反反的的:类类型型抽抽样样要要尽尽量量提提高高组组间间方方差差降降低低组组内内方方差差;整整群群抽抽样样应应尽尽量量提提高高组组内内方方差差降降低低组组间间方方差差。也也就就是是说说,类类型型抽抽样样时时,尽尽量量使使各各组组内内的的单单位位差差异异减减小小,各各组组间间的的单单位位差差异异增增大大;整群抽样时刚好相反。整群抽样时刚好相反。104第一百零四页,本课件共有105页3.阶段抽样平均误差的控制阶段抽样平均误差的控制105第一百零五页,本课件共有105页