《第四章抽样分布最新精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章抽样分布最新精选PPT.ppt(105页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章抽样分布最新第四章抽样分布最新第1页,此课件共105页哦统计推断的过程统计推断的过程样样样样本本本本总总体体样本统计样本统计量量例如:样本例如:样本均值、比例、均值、比例、方差方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差例、方差例、方差例、方差2第2页,此课件共105页哦 学习目标学习目标n1.理解概率及概率分布的意义;理解概率及概率分布的意义;n2.掌握抽样的基本概念以及抽样分布的概念;掌握抽样的基本概念以及抽样分布的概念;n3.掌握总体参数点估计的基本方法及其优良掌握总体参数点估计的基本方法及其优良 标准;标准;n4.掌握总体均值和成数指标的估计方法;掌握总体均值和成
2、数指标的估计方法;n5.了解抽样设计的基本内容。了解抽样设计的基本内容。3第3页,此课件共105页哦 第一节第一节 频率、概率与概率分布频率、概率与概率分布n(Omitted)4第4页,此课件共105页哦 第二节第二节 抽样分布抽样分布 一、抽样的基本概念一、抽样的基本概念 抽样涉及的基本概念有:抽样涉及的基本概念有:1.总体与样本总体与样本(在第一章在第一章)2.样本容量与样本个数样本容量与样本个数 3.总体参数与样本统计量总体参数与样本统计量 这些概念是统计学特有的,体现了统计学的基这些概念是统计学特有的,体现了统计学的基本思想与方法。本思想与方法。5第5页,此课件共105页哦(一)样本容
3、量与样本个数(一)样本容量与样本个数 1.样本容量:样本容量:样本是从总体中抽出的部分单位的集合,这个集样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,它表明一个样本中所包含的合的大小称为样本容量,它表明一个样本中所包含的单位数。单位数。一般地说,样本容量大,抽样误差会小,但调查一般地说,样本容量大,抽样误差会小,但调查费用会增加,反之,样本容量过小,又将导致抽样误费用会增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。因此,在抽样设差增大,甚至失去抽样推断的价值。因此,在抽样设计中应根据调查目的和要求认真考虑合适的样本容量。计中应根据调查目的和要求认真考
4、虑合适的样本容量。6第6页,此课件共105页哦2.样本个数:样本个数:样样本本个个数数又又称称样样本本可可能能数数目目,它它是是指指从从一一个个总总体体中中可可能能抽抽取取多多少少个个样样本本。样本个数的多少与抽样方法有关。关于样本个数的计算我们将在“重复抽样与不重复抽样”中介绍。注意:注意:这这个个概概念念只只是是对对有有限限总总体体有有意意义义,对对无无限限总体没有意义!总体没有意义!7第7页,此课件共105页哦(二)总体参数与样本统计量(二)总体参数与样本统计量1.总体参数:总体参数:总总体体分分布布的的参参数数往往往往是是总总体体的的数数量量特特征征,也是统计推断的对象。也是统计推断的
5、对象。常常见见的的总总体体参参数数有有:总总体体平平均均数数指指标标,总总体体成成数数(比比率率)指指标标,总总体体分分布布的的方方差差、标标准准差差,等等等等。它它们们都都是是反反映映总总体体分分布布特特征征的的重重要要指指标标。总总体体成成数数(也也称称总总体体比比率率)指指标标是是指指总总体体中中具具有有某某性性质质的的单单位位数数目目在在总总体体中中所所占的比重,它反映了总体的结构特征。占的比重,它反映了总体的结构特征。8第8页,此课件共105页哦2.样本统计量:样本统计量:通通俗俗地地说说,样样本本统统计计量量是是样样本本的的函函数数。由由于于样样本本是是从从总总体体中中随随机机地地
6、抽抽出出来来的的,因因此此,样样本本统统计计量量也也是是随随机机变变量量。我我们们利利用用样样本本统统计计量量来来估估计计或或推推断断总总体体的的参参数数和和数数量量特特征征。设已有样本设已有样本 ,常见的统计量有:,常见的统计量有:样本平均数样本平均数 9第9页,此课件共105页哦10第10页,此课件共105页哦(三)重复抽样与不重复抽样(三)重复抽样与不重复抽样1.1.重重复复抽抽样样:重重复复抽抽样样(或或重重置置抽抽样样)是是指指从从总总体体中中抽抽出出一一个个样样本本单单位位,记记录录其其标标志志值值后后,又将其放回总体中继续参加下一轮又将其放回总体中继续参加下一轮抽样抽样。重重复复
7、抽抽样样的的特特点点是是:第第一一,n n个个单单位位构构成成的的样样本本是是n n次次试试验验的的结结果果。第第二二,每每次次试试验验是是独独立立的的,即即其其试试验验的的结结果果与与前前次次、后后次次的的结结果果无无关关。第第三三,每每次次试试验验是是在在相相同同条条件件下下进进行行的的,每每个个单单位位在在每每次次试试验验中中选选中中的的机机会会(概概率率)是是相相同同的的。在在重重复复试试验验中中,样样本本可可能能的的个个数是数是Nn,N N为总体单位数,为总体单位数,n n为样本容量。为样本容量。11第11页,此课件共105页哦2.不不重重复复抽抽样样:不不重重复复抽抽样样亦亦称称为
8、为不不重重置置抽抽样样,即即每每次次从从总总体体抽抽取取一一个个单单位位,登登记记后后不不放放回回原原总总体体,不不参参加加下下一轮抽样。下一次继续从总体中余下的单位抽取样本。一轮抽样。下一次继续从总体中余下的单位抽取样本。其其特特点点是是:n个个单单位位的的样样本本由由 n 次次试试验验结结果果构构成成,但但由由于于每每次次抽抽出出不不重重复复,所所以以实实质质上上相相当当于于从从总总体体中中同同时时抽抽取取n个个样样本本单单位位。如如果果考考虑虑顺顺序序,其其样样本本可可能能个个数数为为 ;如果不考虑顺序,其样本可能个数为;如果不考虑顺序,其样本可能个数为 12第12页,此课件共105页哦
9、 二、抽样分布二、抽样分布(一一)重复抽样分布重复抽样分布13第13页,此课件共105页哦 所以,由概率论知,如果总体是正态分布的,所以,由概率论知,如果总体是正态分布的,则则样本平均数的抽样分布是如下样本平均数的抽样分布是如下正态分布正态分布这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。14第14页,此课件共105页哦 某班组某班组5个工人的日工资个工人的日工资为为34、38、42、46、50元。元。现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有52=25个样本。个样本。例例 子子15第15页,此课件共105页哦
10、 此指标反映所有的样本平均此指标反映所有的样本平均数与总体平均数的平均误差,称数与总体平均数的平均误差,称为为抽样平均误差抽样平均误差,用,用 表示。表示。n得出两个结论得出两个结论16第16页,此课件共105页哦2.2.总体成数的估计总体成数的估计样本成数分布的性质:样本成数分布的性质:总总体体成成数数p是是指指具具有有某某种种特特征征的的单单位位在在总总体体中中的的比比重重。在在前前面面我我们们已已经经知知道道,成成数数是是一一个个特特殊殊平平均均数数,设设总总体体单单位位总总数数目目是是N,总总体体中中有有该特征的单位数是该特征的单位数是N N1 1。设。设X是是0、1变量,变量,即:总
11、体单位有该特征,则即:总体单位有该特征,则X取取1,否则取,否则取0,则有:,则有:现现从从总总体体中中抽抽出出n n个个单单位位,如如果果其其中中有有相相应应特特征征的的单单位位数数是是n n1 1,则则样样本本成数是:成数是:17第17页,此课件共105页哦 P也也是是一一个个随随机机变变量量,利利用用样样本本平平均均数数的的分分布布性性质质结论,即有:结论,即有:E(P)=p18第18页,此课件共105页哦(二二)不重置抽样分布不重置抽样分布1、样本平均数的分布、样本平均数的分布 某班组某班组5个工人的日工资个工人的日工资为为34、38、42、46、50元。元。现用不重置抽样的方法从现用
12、不重置抽样的方法从5人中随机抽人中随机抽2个构成样本。共个构成样本。共有有20个样本。个样本。19第19页,此课件共105页哦20第20页,此课件共105页哦得出两个结论:得出两个结论:此指标反映所有的样本平均数与总体平均数的平此指标反映所有的样本平均数与总体平均数的平均误差,称为均误差,称为抽样平均误差抽样平均误差,用,用 表示。表示。21第21页,此课件共105页哦2.样本成数的分布样本成数的分布 抽样平均误差为:抽样平均误差为:对于(对于(0,1)分布的总体,)分布的总体,总体平均数为:总体平均数为:总体方差为:总体方差为:从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样
13、本成数p的分布实质是样本的分布实质是样本平均数的分布。有:平均数的分布。有:22第22页,此课件共105页哦三、大数定理与中心极限定理三、大数定理与中心极限定理(一一)大数定理大数定理 大大数数定定理理又又称称作作大大数数法法则则。人人们们在在观观察察个个别别事事物物时时,是是连连同同一一切切个个别别的的特特性性来来观观察察的的。个个别别现现象象受受偶偶然然因因素素影影响响,有有各各自自不不同同的的表表现现。但但是是,对对总总体体的的大大量量观观察察后后进进行行平平均均,就就能能使使偶偶然然因因素素的的影影响响相相互互抵抵消消,消消除除由由个个别别偶偶然然因因素素引引起起的的极极端端性性影影响
14、响,从从而而使使总总体体平平均均数数稳稳定定下下来来,反反映映出出事事物物变变化化的的一一般般规规律,这就是大数定理的意义。律,这就是大数定理的意义。23第23页,此课件共105页哦24第24页,此课件共105页哦25第25页,此课件共105页哦 2.中心极限定理中心极限定理 26第26页,此课件共105页哦第三节第三节 总体参数估计总体参数估计一、总体参数估计概述一、总体参数估计概述n总体参数估计就是以样本统计量来估计总体总体参数估计就是以样本统计量来估计总体参数。参数。n参数估计应满足以下两个要求:一是估计的参数估计应满足以下两个要求:一是估计的精度要求,二是可靠性要求。所谓精度就是精度要
15、求,二是可靠性要求。所谓精度就是估计误差的最大范围,即误差的最大值,可估计误差的最大范围,即误差的最大值,可通过极限误差来反映;所谓可靠性是指估计通过极限误差来反映;所谓可靠性是指估计结果正确的概率大小。结果正确的概率大小。27第27页,此课件共105页哦28第28页,此课件共105页哦参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计29第29页,此课件共105页哦二、点二、点 估估 计计第30页,此课
16、件共105页哦(一一)点估计的定义点估计的定义 点估计就是根据总体参数与样本统计量之间的内在联点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计量。系,直接以样本统计量作为相应总体参数的估计量。在统在统计中经常使用的点估计量有:计中经常使用的点估计量有:31第31页,此课件共105页哦 【例例4-9】对某企业的产品进行抽样检验,设对某企业的产品进行抽样检验,设 抽抽出出100件件产产品品,其其中中不不合合格格产产品品5件件,试试估估计计该该企企业业产产品的合格率是多少?品的合格率是多少?我我们们可可以以通通过过样样本本的的合合格格率率来来估估计计企企业业产
17、产品品的的合合格格率率。样样本本合合格格率率p=95/100=95%,我我们们估估计计该该企企业业产产品品的的合合格格率率是是95%。32第32页,此课件共105页哦(二二)估计的评价标准估计的评价标准n点点估估计计的的优优点点是是直直接接给给出出了了总总体体参参数数的的估估计计值值。不不足足之之处是不能提供估计误差的信息。处是不能提供估计误差的信息。n样样本本统统计计量量是是一一个个随随机机变变量量,从从一一次次抽抽样样的的结结果果来来判判断断一一个个统统计计量量的的优优劣劣是是没没有有理理由由的的,必必须须通通过过多多次次试试验验或或从从抽抽样样分分布布的的特特点点出出发发,才才能能判判断
18、断这这个个估估计计量量是是否为否为优良优良的估计量。的估计量。n点点估估计计优优良良性性准准则则主主要要包包括括三三条条:无无偏偏性性、有效性有效性和和一致性一致性。33第33页,此课件共105页哦1.无偏性无偏性 34第34页,此课件共105页哦估计量的优良性准则估计量的优良性准则(无偏性)(无偏性)n无无偏偏性性:估估计计量量的的数数学学期期望望等等于于被被估估计计的的总总体体参数参数P P(X X)X XCA无无 偏偏有有有有 偏偏偏偏35第35页,此课件共105页哦例:例:这就是为什么样本方差用这就是为什么样本方差用n-1的原因!的原因!36第36页,此课件共105页哦2.有效性有效性
19、 37第37页,此课件共105页哦估计量的优良性准则估计量的优良性准则(有效性)(有效性)AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)有效性:有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,样本均值是一个更有效的估计量38第38页,此课件共105页哦3.一致性一致性 39第39页,此课件共105页哦估计量的优良性准则估计量的优良性准则(一致性)(一致性)n一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量量越越来来越
20、接近被估计的总体参数越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X40第40页,此课件共105页哦三、区间估计三、区间估计第41页,此课件共105页哦(一一)区间估计的含义区间估计的含义42第42页,此课件共105页哦区间估计区间估计(概念要点)(概念要点)1.根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率3.例如例如:总体均值落在总体均值落在5070之间,置信度为之间,置信度为
21、 95%样本统计量样本统计量(点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限43第43页,此课件共105页哦置信区间估计置信区间估计(内容)(内容)2 2 已知已知 2 2未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间44第44页,此课件共105页哦落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX=Z x95%95%的样本的样本的样本的样本 -1.96 x +1.96 x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1
22、.65 x x45第45页,此课件共105页哦1.总体未知参数落在区间内的概率总体未知参数落在区间内的概率2.表示为表示为(1-n 为显著性水平,是总体参数为显著性水平,是总体参数未在未在区间内区间内的概率的概率 3.常用的置信水平值有常用的置信水平值有 99%,95%,90%n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平(置信度置信度)46第46页,此课件共105页哦区间与置信水平区间与置信水平 均值的抽样分布均值的抽样分布(1-)%区间包含了区间包含了%的区间未包含的区间未包含 1-1-/2 2 /2 247第47页,此课件共105页哦影响区间宽度
23、影响区间宽度Z的因素的因素1.数据的离散程度,数据的离散程度,用用 来测度来测度2.样本容量,样本容量,3.置信水平置信水平(1-),影响,影响 Z 的大小的大小48第48页,此课件共105页哦(二二)平均数的区间估计平均数的区间估计1.总体方差已知总体方差已知(已知已知):由由抽抽样样分分布布定定理理知知道道,如如果果总总体体服服从从正正态态分分布布,则则样样本本平平均均数数 ;如如果果总总体体正正态态性性不不成成立立,但但是是当当样样本本容容量量n充充分分大大时时,近似地也有近似地也有 因此,因此,49第49页,此课件共105页哦50第50页,此课件共105页哦51第51页,此课件共105
24、页哦52第52页,此课件共105页哦53第53页,此课件共105页哦54第54页,此课件共105页哦2.总体方差未知总体方差未知55第55页,此课件共105页哦56第56页,此课件共105页哦第二步:根据给定的置信度第二步:根据给定的置信度90%,查,查t-分布概率表分布概率表得:得:第三步:计算允许误差第三步:计算允许误差57第57页,此课件共105页哦58第58页,此课件共105页哦(三三)成数指标的区间估计成数指标的区间估计59第59页,此课件共105页哦例例 子子【例例4-12】某工厂要估计一批总数某工厂要估计一批总数5 000件的产品的废品率,于是件的产品的废品率,于是随机抽出随机抽
25、出400件产品进行检测,发现有件产品进行检测,发现有32件废品。试给出该批产品的件废品。试给出该批产品的废品率的区间估计废品率的区间估计(置信度是置信度是90%)。60第60页,此课件共105页哦1.总体平均数的区间估计总体平均数的区间估计第一,样本抽取后,用简单算术平均或加权平均的方第一,样本抽取后,用简单算术平均或加权平均的方法计算样本平均数法计算样本平均数 。第二,搜集总体数量标志方差的经验数据或计算样本第二,搜集总体数量标志方差的经验数据或计算样本数量标志方差数量标志方差S2。第三,计算抽样平均数的平均误差:第三,计算抽样平均数的平均误差:第四,根据概率第四,根据概率F(Z)确定确定Z
26、,计算平均数的极限误差,计算平均数的极限误差 。第五,总体平均数的置信区间。第五,总体平均数的置信区间。区间估计小结区间估计小结61第61页,此课件共105页哦2.总体成数的区间估计总体成数的区间估计第一,样本抽取后,计算样本成数。第一,样本抽取后,计算样本成数。第二,用样本是非标志方差第二,用样本是非标志方差p(1-p)或经验数据代替总体或经验数据代替总体是非标志方差是非标志方差P(1-P)。第三,计算抽样成数的平均误差:第三,计算抽样成数的平均误差:第四,根据概率第四,根据概率F(Z)确定确定Z,计算平均数的极限误差,计算平均数的极限误差 。第五,总体平均数第五,总体平均数P的置信区间。的
27、置信区间。62第62页,此课件共105页哦四、四、样本容量的确定样本容量的确定63第63页,此课件共105页哦(一一)估计总体均值时样本容量的确定估计总体均值时样本容量的确定64第64页,此课件共105页哦n【例例4-13】某企业想估计其职工上个月上下班花在路途上的平均时某企业想估计其职工上个月上下班花在路途上的平均时间。经验表明,总体标准为间。经验表明,总体标准为4.3分钟。以置信度分钟。以置信度95%的置信区间进的置信区间进行估计,并使估计值处在真正平均值附近行估计,并使估计值处在真正平均值附近1分钟的误差范围之内。分钟的误差范围之内。该企业应抽取多大的样本?该企业应抽取多大的样本?n解:
28、已知解:已知该企业至少应该抽取该企业至少应该抽取72名职工作为样本。名职工作为样本。65第65页,此课件共105页哦66第66页,此课件共105页哦(二二)估计成数时样本容量的确定估计成数时样本容量的确定67第67页,此课件共105页哦(三三)使用上述公式应注意的问题使用上述公式应注意的问题n1.计算样本容量时,一般总体的方差与成数都是未知的,可计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代:一是用历史资料已有的方差与成数代替;用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中二是在进行正式抽样调查前进行几次试验性调查,用
29、试验中方差的最大值代替总体方差;三是成数方差在完全缺乏资料方差的最大值代替总体方差;三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值的情况下,就用成数方差的最大值0.25代替。代替。n2.如果进行一次抽样调查,同时估计总体均值与成数,用如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个最大的结上面的公式同时计算出两个样本容量,可取一个最大的结果,同时满足两方面的需要。果,同时满足两方面的需要。n3.上面的公式计算结果如果带小数,这时样本容量不按四上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如舍五
30、入法则取整数,取比这个数大的最小整数代替。例如计算得到:计算得到:n=56.03,那么,样本容量取,那么,样本容量取57,而不是,而不是56。68第68页,此课件共105页哦69第69页,此课件共105页哦70第70页,此课件共105页哦第四节第四节 抽样设计抽样设计(重点掌握概念重点掌握概念)抽抽样样估估计计效效果果好好坏坏,关关键键是是抽抽样样平平均均误误差差的的控控制制。抽抽样样平平均均误误差差小小,抽抽样样效效果果从从整整体体上上看就是好的;否则,抽样效果就不理想。看就是好的;否则,抽样效果就不理想。从从前前面面的的分分析析知知道道,抽抽样样平平均均误误差差受受以以下下几几方方面面的的
31、因因素素影影响响:一一是是总总体体的的变变异异性性,即即与与总总体体的的标标准准差差大大小小有有关关;二二是是样样本本容容量量;三三是是抽抽样样方方法法(重重置置与与不不重重置置)。还还有有一一个个重重要要的的因因素,就是抽样的组织形式。素,就是抽样的组织形式。71第71页,此课件共105页哦n抽样的组织形式有:简单随机抽样、类型抽抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样等。不样、等距抽样、整群抽样、阶段抽样等。不同抽样组织设计意味着对总体信息不同程度同抽样组织设计意味着对总体信息不同程度的利用,意味着不同的调查成本,它们之间的利用,意味着不同的调查成本,它们之间
32、抽样效果存在较大的差异。前面我们讨论的抽样效果存在较大的差异。前面我们讨论的抽样组织形式,都是简单随机抽样。接下来抽样组织形式,都是简单随机抽样。接下来我们讨论其他几种抽样组织方式及其抽样平我们讨论其他几种抽样组织方式及其抽样平均误差。均误差。72第72页,此课件共105页哦总方差、组间方差和组内方差(总方差、组间方差和组内方差(P75)n例子:某公司下属例子:某公司下属7个门市部某月营业额(单位:个门市部某月营业额(单位:万元)如下:万元)如下:88,90,96,98,110,140,200按营业额分两组:按营业额分两组:第一组:第一组:88,90,96,98第二组:第二组:110,140,
33、200根据上述资料可以计算根据上述资料可以计算:n总平均营业额:总平均营业额:n营业额的总方差:营业额的总方差:73第73页,此课件共105页哦总方差、组间方差和组内方差总方差、组间方差和组内方差第一组:第一组:88,90,96,98第二组:第二组:110,140,200根据上述资料可以计算:根据上述资料可以计算:n第一组平均营业额:第一组平均营业额:n第一组营业额的组内方差:第一组营业额的组内方差:n第二组平均营业额:第二组平均营业额:n第二组营业额的组内方差:第二组营业额的组内方差:n组内方差的平均数:组内方差的平均数:74第74页,此课件共105页哦总方差、组间方差和组内方差总方差、组间
34、方差和组内方差第一组平均营业额:第一组平均营业额:第二组平均营业额:第二组平均营业额:总平均营业额:总平均营业额:组间方差:组间方差:总方差总方差609.71795.671405.38总方差组内方差的平均数组间方差总方差组内方差的平均数组间方差75第75页,此课件共105页哦一、一、类型抽样类型抽样(分层抽样分层抽样)它它是是按按一一定定标标志志对对总总体体各各单单位位进进行行分分类类,然然后后分分别别从从每每一一类类中中按随机原则抽取一定的单位构成样本。按随机原则抽取一定的单位构成样本。类类型型抽抽样样的的前前提提是是对对总总体体的的结结构构有有着着一一定定的的了了解解,为为了了充充分分利利
35、用用这这些些信信息息,提提高高估估计计的的精精确确性性,对对总总体体按按确确定定标标志志进进行行分分类类,保证抽出的样本与总体尽可能保持相似的结构。保证抽出的样本与总体尽可能保持相似的结构。例例如如,抽抽样样调调查查一一个个城城市市居居民民收收入入分分配配状状况况,如如果果历历史史资资料料反反映映了了该该城城市市居居民民的的贫贫富富结结构构:高高收收入入者者、中中等等收收入入者者与与低低收收入入者者的的比比例例结结构构,我我们们可可以以按按此此结结构构分分类类分分别别从从高高收收入入者者、中中等等收收入入者者与与低低收收入入者者中中按按一一定定的的比比例例抽抽取取样样本本。这这样样就就可可以以
36、避避免免样样本本全全来来自自某某一一收收入入阶阶层层所所产产生生的的系统偏差。系统偏差。76第76页,此课件共105页哦77第77页,此课件共105页哦78第78页,此课件共105页哦79第79页,此课件共105页哦80第80页,此课件共105页哦81第81页,此课件共105页哦二、二、整群抽样整群抽样 整整群群抽抽样样就就是是将将总总体体各各单单位位分分成成若若干干群群,然然后后从从其其中中随随机抽取部分群,对中选的群进行全面调查的抽样组织方式。机抽取部分群,对中选的群进行全面调查的抽样组织方式。在在总总体体单单位位数数很很大大时时,如如果果直直接接从从总总体体中中抽抽取取总总体体单单位位,
37、有有时时是是很很困困难难的的,比比如如从从一一个个大大城城市市中中的的所所有有大大学学生生中中抽抽样样了了解解大大学学生生的的基基本本情情况况,这这个个城城市市的的大大学学生生人人数数有有几几十十万万之之众众,直直接接抽抽取取样样本本单单位位有有许许多多困困难难。如如果果按按整整群群抽抽样样,以以班班级级为为抽抽样样单单位位,从从全全部部学学校校的的所所有有班班级级中中抽抽出出部部分分班班级级,调调查查抽抽中中的的班班级级,就方便多了。就方便多了。82第82页,此课件共105页哦83第83页,此课件共105页哦84第84页,此课件共105页哦85第85页,此课件共105页哦.86第86页,此课
38、件共105页哦.87第87页,此课件共105页哦三、三、等距抽样等距抽样.88第88页,此课件共105页哦89第89页,此课件共105页哦 【例例4-17】某块麦地长某块麦地长300米,宽米,宽120米,包括米,包括120条垅,每垅长条垅,每垅长300米。现从这块麦地按等距抽样的方式,抽取米。现从这块麦地按等距抽样的方式,抽取50个个2米长米长垅为样本单位进行实割实测。样本距离为麦垅总长除以样本垅为样本单位进行实割实测。样本距离为麦垅总长除以样本单位数,即单位数,即300120/50=720(米米)。现从地角一边样本距离之半处抽取。现从地角一边样本距离之半处抽取第一个样本单位,即从第一个样本单
39、位,即从360米点前后各米点前后各1米为第一个样本单位,以后米为第一个样本单位,以后每隔每隔720米取一个样本单位,一直抽取出米取一个样本单位,一直抽取出50个样本单位为止。实测各样个样本单位为止。实测各样本单位产量如表本单位产量如表4-8-8。试计算平均亩产量的抽样平均误差,并以试计算平均亩产量的抽样平均误差,并以95%95%的的概率保证估计这块麦地的亩产量和总产量。概率保证估计这块麦地的亩产量和总产量。90第90页,此课件共105页哦91第91页,此课件共105页哦92第92页,此课件共105页哦93第93页,此课件共105页哦四、四、阶段抽样阶段抽样94第94页,此课件共105页哦95第
40、95页,此课件共105页哦96第96页,此课件共105页哦97第97页,此课件共105页哦98第98页,此课件共105页哦。99第99页,此课件共105页哦100第100页,此课件共105页哦101第101页,此课件共105页哦五、五、不同抽样组织设计的比较不同抽样组织设计的比较1.102第102页,此课件共105页哦2.类型抽样与整群抽样比较类型抽样与整群抽样比较 类类型型抽抽样样的的平平均均误误差差与与组组间间方方差差无无关关,决决定定于于组组内内方方差差的的平平均均水水平平;整整群群抽抽样样的的平平均均误误差差与与组组内内方方差差无无关关,决决定定于于组组间间方方差差大大小小。总总体体方
41、方差差等等于于组组间间方方差差加加上上组组内内方方差差平平均均数数。我我们们由由此此可可推推导导出出减减小小类类型型抽抽样样与与整整群群抽抽样样平均误差的方法。平均误差的方法。103第103页,此课件共105页哦(1)减减小小类类型型抽抽样样平平均均误误差差的的办办法法。提提高高组组间间方方差差,降降低低组组内内方方差差。具具体体来来说说,就就是是使使类类型型抽抽样样的的各各部部分分内内部部单单位位差差异异尽尽可可能能地地小小,不不同同类类型型间间的的差差异异尽尽可可能能地地大大。如如果果组组间间方方差差接接近近于于总总体体方方差差,说说明明组组内内方方差差接接近近于于0,这这时时组组内内单单
42、位位基基本本上上没没有有差差异异,这这是是一一种种极极端端情情况况,类型抽样的平均误差接近于类型抽样的平均误差接近于0。(2)减减小小整整群群抽抽样样平平均均误误差差的的办办法法。为为了了降降低低抽抽样样平平均均误误差差,应应该该设设法法降降低低群群间间方方差差。可可通通过过提提高高群群内内方方差差方方法法达达到到降降低低群群间间方方差差目目的的。因因此此,类类型型抽抽样样与与整整群群抽抽样样对对总总体体进进行行分分组组的的要要求求刚刚好好是是相相反反的的:类类型型抽抽样样要要尽尽量量提提高高组组间间方方差差降降低低组组内内方方差差;整整群群抽抽样样应应尽尽量量提提高高组组内内方方差差降降低低组组间间方方差差。也也就就是是说说,类类型型抽抽样样时时,尽尽量量使使各各组组内内的的单单位位差差异异减减小小,各各组组间间的的单单位位差差异异增增大大;整整群群抽抽样样时时刚好相反。刚好相反。104第104页,此课件共105页哦3.阶段抽样平均误差的控制阶段抽样平均误差的控制105第105页,此课件共105页哦