《抽样推断与参数估计.ppt》由会员分享,可在线阅读,更多相关《抽样推断与参数估计.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、现在学习的是第1页,共66页一、抽样方法抽样方法有两种:概率抽样和非概率抽样。(一)概率抽样它根据随机原则,以一定的入样概率,从现象总体中随机抽取若干样本单位,然后计算样本单位的数量特征(称为统计量),并以此来推断估计总体参数。参数估计可分为点估计和区间估计。1.随机抽样的特点数据的随机性;抽样方法的随机性;当用样本统计量来估计总体参数时,不但要考虑样本单位的数量特征,也要考虑各样本单位的入样概率;随机抽样要求样本单位的入样概率通过一定的随机化程序来实现。现在学习的是第2页,共66页2.随机抽样的意义总体现象各个单位数据的分布,在大量观察的情况下,它服从一定的概率分布,当数据足够多时,它一般表
2、现为正态分布的特征。用随机原则抽取样本单位,完全排除人为的干扰抽取样本单位,才能排除样本单位的有偏分布,才能保证 样本单位的分布结构与总体单位分布结构的一致性,才能够应用相应的分布概率来进行总体参数估计。(二)非概率抽样相对于概率抽样而言,非概率抽样在我国的统计学教科书中有所谓的重点调查、典型调查。现在学习的是第3页,共66页在国外的教科书中称之为:目的抽样、随意(便)抽样、判断抽样、配额抽样等。总之,非概率抽样的一个特点是样本单位的抽选是根据调查者的主观判断,有目的、有意识地或根据方便的原则来进行的,而不是按随机原则来抽取样本单位。用非概率抽样方法抽取的样本单位,所计算的样本数据来进行总体的
3、参数估 计时,往往是有偏估计,它不能从概率意义上来估计抽样误差,并以此来保证抽样推断估计的准确性。现在学习的是第4页,共66页(一)对不必要和不可能进行全面调查的现象,可以通过抽样调查,取得样本数据来推断总体的数量特征。(二)适用于对那些要求时效性强,调查周期短的现象所进行的调查。(三)对全面调查(普查)的补充和修正。(四)抽样调查能够节约调查的人力、物力和财力,从而大大地降低调查费用。现在学习的是第5页,共66页 在我国,解放前科学的统计工作相当薄弱,统计学主要受英美流派的影响。抗战期间清华大学的国情调查研究所由戴世光主持、进行云南省呈贡县人口抽样调查。解放后,我国的统计工作主要学习苏联,按
4、照计划经济的特点实行全面定期报表统计制度。但面对我国各地域社会经济发展状况的不同,根据不同的研究目的,也提出采用多种调查方法,其中也包括抽样调查方法。我国在1955年开始进行农民家计抽样调查,1956年开始城镇职工家计调查,1963年建立农产量调查队。但这些抽样调查都随着十年文化革命期间而停顿。同时,抽样调查的理论研究也很少有人进行。现在学习的是第6页,共66页二十世纪八十年代以来,我国实行改革开放政策,用社会主义市场经济取代计划经济,调查对象主体日益多元化和复杂化,仅靠全面定期报表制度来搜集社会经济发展数据的调查体系已不能适应社会发展的需要,不能满足国家宏观决策和调控部门、公司企业和社会公众
5、对统计信息的需求,于是科学的抽样调查方法受到人们的日益重视,抽样调查的应用实践和理论研究进入了一个新时期。1981年国家统计局建立农村抽样调查队和城市抽样调查队,1994年成立企业调查队,分别进行农民家庭生活收支、城镇居民生活收支、农产量、城乡物价、企业景气等各种社会经济抽样调查。2006年国家实行统计管理体制改革,实行三个调查队的合并,统筹进行各种社会经济现象的抽样调查。同时有关政府主管部门和研究机构,为某个政策研究目的而分别进行专题抽样调查。现在学习的是第7页,共66页二战以后,美国质量管理专家戴明在日本推广抽样统计质量管理方法,对提升日本产品质量起了巨大的作用,“戴明奖”成为日本政府最高
6、级别的质量管理奖。二十世纪八十年代我国北京人民机器厂引进日本小松制作所的抽样统计质量管理方法,在中国科学院刘源张教授的指导下,进行抽样方法在产品质量管理中的应用实践,取得很好的效果。现在统计质量管理方法已普遍成为我国工业产品质量控制和服务质量管理的一个重要方法。为适应我国社会经济发展和体制改革的需要,促进经济增长方式的根本转变,促进社会和谐发展,1994年国务院批转国家统计局关于改革我国统计调查体系的请示,其改革的目标模式是:建立以必要的周期性普查为基础,以经常性抽样调查为主体,同时辅以重点调查、科学推算等多种方法综合运用的统计调查方法体系。现在学习的是第8页,共66页 由于社会的需要和重视,
7、抽样调查方法在经济学、管理学、社会学等学科的研究中得到广泛应用,在市场调查、民意测验、政府绩效评价、犯罪调查、舆论信息反馈、劳动就业、社会保障政策评价、质量管理等方面起了越来越重要的作用。在我国所有的统计学教科书中都写入抽样调查的有关章节内容,高等院校的统计学专业、社会学专业都把抽样调查的理论和方法应用列为一门必修的专业课。现在学习的是第9页,共66页(一)、大数定理11lim1ninipXnlim1nmppn当样本容量n 充分大时,可以用样本平均估计总体平均。当试验次数n充分大时,可以用频率代替概率。大数定理的意义:个别现象受偶然因素影响,但是,对总体的大量观察后进行平均,就能使偶然因素的影
8、响相互抵消,从而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。现在学习的是第10页,共66页 正态分布的再生定理:相互独立的两个正态随机变量相加之和仍服从正态分布。中心极限定理:大样本的平均数近似服从正态分布。2,XNn现在学习的是第11页,共66页 二、抽样的基本概念(一)、总体与样本(见第一章)1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用 N 表示。2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。3.总体是唯一的、确定的,而样本是不确定的、可变
9、的、随机的。现在学习的是第12页,共66页1、样本容量:一个样本中所包含的单位数,用n表示。2、样本个数:又称样本可能数目,指从一个 总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(这个概念只是对有限总体有意义,对无限总体没有意义!)现在学习的是第13页,共66页1、总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。2、样本统计量:根据样本分布计算的指标。是随机变量。平均数标准差、方差成数参数、2P统计量S、S2p总体样本X22()1x xsn22()1ffx xs现在学习的是第14页,共66页1、重复抽样:例如从A、B、C、D、E五个
10、字母中随机抽取两个作为样本。N=5,n=2 考虑顺序时:样本个数=Nn=52=25 不考虑顺序时:样本个数=ABACDEBBCDAECBCDAEDBCDAEEBCDAE-(-)!(-)!111nNnNnCNn现在学习的是第15页,共66页ABCDEBCDAECBDAEDBCAEEBCDA!(N-n)!nNNPABCDEBCDECDEDEE!(N-n)!n!nNNC2、不重复抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数不考虑顺序时:样本个数现在学习的是第16页,共66页 抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分
11、配数列。(主要求出样本平均数的期望与方差)现在学习的是第17页,共66页 某班组5个工人的日工资为34、38、42、46、50元。=422=32 现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。现在学习的是第18页,共66页 验证了以下两个结论:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用 表示。()()42 元XfE XXf()()()22216 元XXfXfX()E X()22nXXn现在学习的是第19页,共66页 由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布 这是一个非常重要的结论,有广泛的应用。
12、(请参见中心极限定理。)2(,)Nn现在学习的是第20页,共66页总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单位总数目是N,总体中有该特征的单位数是N1。设x是0、1变量(总体单位有该特征,则x取1,否则取0),则有:现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:P也是一个随机变量,利用样本平均数的分布性质结论,即有:1NpxN1nPn()11E PpppppPnnn现在学习的是第21页,共66页 样本均值的分布性质:样本成数的分布性质2()()1XE XNnXnN()11E PpppNnPnN现在学习的是第22页,共66页样本平均数
13、的分布样本成数的分布重复抽样不重复抽样()E X()nX 1ppPn()E X()E Pp2()1NnXnN()E Pp 11ppNnPnN现在学习的是第23页,共66页从以上公式可看出,影响抽样误差的因素有:1.总体方差 ,它与抽样误差成正比例关系,当总体方差越大时,抽样误差也越大。当总体方差未知时,可用样本方差代替。2.样本容量n,它与抽样误差成反比例关系,当抽取的样本单位数越多时,抽样误差越小。3.不重复抽样的抽样误差比重复抽样的小,当N相对于n很大时,两者很接近。4.不同的抽样组织形式,其抽样误差也各不相同。2()X现在学习的是第24页,共66页 参数估计参数估计,通俗地说,就是根据抽
14、样结果,通俗地说,就是根据抽样结果来合理地、科学地估计总体的参数很可能是什来合理地、科学地估计总体的参数很可能是什么?或者在什么范围。么?或者在什么范围。点估计点估计:根据样本数据算出一个单一的估:根据样本数据算出一个单一的估计值,用来估计总体的参数值。计值,用来估计总体的参数值。区间估计区间估计:计算抽样平均误差,指出估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。体参数的所在范围或区间。现在学习的是第25页,共66页 1、总体参数估计指以样本统计量来估计总体参数.2、设待估计的总体参数是,用以估计该参数
15、的统计量是 ,抽样估计的极限误差是,即:3、极限误差是根据研究对象的变异程度和分析任 务的性质来确定的在一定概率下的允许误差范围。参数估计的两个要求:精度:估计误差的最大范围,通过极限误差来反映。显然,越小,估计的精度要求越高,越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。可靠性:估计正确性的一个概率保证,通常称为估计的置信度。估计中精度要求和可靠性要求是一对矛盾。现在学习的是第26页,共66页(一)、点估计的含义点估计的含义:直接以样本统计量作为相应总体参数的估计量。优点:直接给出了总体参数的估计值缺点:不能提供有关抽样误差的信息2221XpPXXsn现在学习的是第27页,
16、共66页优良估计标准:无偏性:要求样本统计量的平均数等于被估计的总体参数本身。一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。有效性:若 是总体参数,是估计 的样本统计量。(),E即满足无偏性。lim()1nP ()为任意小的正数1222121,若 和都是 的无偏估计量,而则称 更有效。X经经数数学学证证明明,是是 的的无无偏偏、一一致致且且有有效效的的估估计计量量。总体方差的无偏估计量为样本方差x xSn22()1点估计完全正确的概率通常为0。即没有解决参数估计的精确度和可靠度要求,因此,我们更多的是考虑用样本统计量去估计总体参数的范围 区间估计。现在学习的是第28页,共66页2
17、 已知2 未知 均 值方 差成数置 信 区 间现在学习的是第29页,共66页(一)、参数区间估计的含义 1、含义:根据样本求出总体未知参数的区间范围,并给出区间估计成立的概率值。2、显著性水平、置信度和置信区间 设 和 都是样本的两个统计量,且 ,对于给定的0 1有则称区间(,)为 的 的置信区间其中:1-(01)称为置信度;是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%。1p12()1注对上式的理解:例如抽取了1000个样本,根据每一个样本均构造了一个置信区间,这样,由1000个样本构造的总体参数的1000个置信区间中,有95%的区间包含了总体参数的真值,而5%的
18、置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。22112(1)现在学习的是第30页,共66页真值只有一个,一个特定的区间“总是包含”或“绝对不包含”该真值。但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:该班同学平均成绩的置信区间是60-80分,置信度为95%。现在学习的是第31页,共66页1、基本要素包括:样本点估计值、抽样极限误差、估计的可靠程度 样本点估计值()抽样极限误差:可允许的误差范围
19、。抽样估计的可靠程度(置信度、概率保证程度)注意:本教材所进行的区间估计仅指对总体平均数或成数的区间估计x现在学习的是第32页,共66页XXXnXXnXX,1,1,2222当x统计上把给定的抽样误差叫做抽样极限误差抽样误差范围:指样本统计量与总体参数的可能离差范围是根据概率原理以一定的概率保证度保证误差不超过某一给定的范围服从标准正态分布时,通常记z=简记为z=请牢记该式.当中,总体方差用样本方差代替,则服从t分布时,通常记t,z与t通常也称为临界值现在学习的是第33页,共66页1、当总体方差 已知时,总体均值u的区间估计 如总体服从正态分布,则 服从标准正态分布N(0,1)。如总体正态性不成
20、立,但是样本量n充分大时,近似的也有 服从标准正态分布N(0,1),查正态分布概率表,可得 (一般记为 ),则 ,根据重复抽样与不重复抽样的 求法的不同,进一步可得总体平均数的估计区间:重复抽样时,区间的上下限为:不重复抽样时,区间的上下限为:2XXXF(/)1Xz/2X2Xzn21NnXzNnz/2XXX/现在学习的是第34页,共66页2、若总体方差未知,则在计算 时,使用样本方差 代替总体方差,此时 服从自由度为n-1的t分布。查t分布表可得 ,并记为 于是:重复抽样时,区间的上下限为:不重复抽样时,区间的上下限为:XXX/nt,12,12nSXtn,121nSNnXtNn大样本时,t分布
21、与标准正态分布非常接近,可直接从标准正态分布表查临界值,12ntX现在学习的是第35页,共66页 由于总体的分布是(0,1)分布,只有在大样本的情况下,才服从正态分布。总体成数可以看成是一种特殊的平均数,类似于总体平均数的区间估计,总体成数的区间估计的上下限是:注意:在实践中,由于总体成数常常未知,这时,抽样平均误差公式中的总体成数用样本成数代替。大样本的条件:np5且n(1-p)5,由于总体成数p通常未知,可以用样本成数来近似判断。PPz2Pppn1PppNnnN11现在学习的是第36页,共66页XXXp()1p X ()1总体平均数估计区间的上下限总体方差已知N(0,1)重复抽样不重复抽样
22、总体方差未知t(n-1)大样本时近似服从N(0,1)重复抽样不重复抽样XX所服从的分布Xn/Sn/1NnNn1SNnNn,12nSXtn,121nSNnXtNn2Xzn21NnXzNnn 如果是正态总体现在学习的是第37页,共66页 如果不是正态总体,或分布未知总体方差已知且是大样本总体方差未知且是大样本 XXN(0,1)近似服从XXN(0,1)近似服从此时不考虑小样本情况XnNnNn/1或XSnSNnNn/1或因此,大样本情况下,直接用标准正态分布求置信区间即可。现在学习的是第38页,共66页 某种零件的长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4MM,已知总体标准差
23、为0.15MM,试建立该种零件的平均长度的置信区间,给定的置信度为95%现在学习的是第39页,共66页 某商场从一批食品(共800袋)中随机抽取40袋(假设用重复抽样),测得每袋平均重量为791.1克,标准差为17.136克,要求以95%的把握程度,估计这批食品的平均每袋重量以及这批食品总重量的区间范围。现在学习的是第40页,共66页 总体成数估计区间的上下限只考虑大样本情况(请记住大样本条件)PPPzn21PPNnPznN211现在学习的是第41页,共66页 某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质率为85%,试计算当把握程度为90%时优质品率的区间范围。现在
24、学习的是第42页,共66页1、什么是样本容量确定问题?XXzzF z()1XXXp()1现在学习的是第43页,共66页2、在设计抽样时,先确定允许的误差范围和必要的概率保证程度,然后根据历史资料或试点资料确定总体的标准差,最后来确定样本容量。估计总体均值时样本容量的确定重复抽样 不重复抽样 估计成数时样本容量的确定重复抽样 不重复抽样 2xzn2222xzn2222222xNznNz 21xnzNn2221pzppn2222211pNzppnNzpp现在学习的是第44页,共66页 计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正
25、式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值0.25代替。如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个最大的结果,同时满足两方面的需要。上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:n=56.03,那么,样本容量取57,而不是56。现在学习的是第45页,共66页对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为90%。现采用重复抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极
26、限误差不超过0.08米,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?现在学习的是第46页,共66页对某批木材进行检验,根据以往经验,木材的合格率为90%、92%、95%。现采用重复抽样方式,要求在95.45%的概率保证程度下,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?现在学习的是第47页,共66页一、纯随机抽样纯随机抽样又称简单随机抽样。用概率抽样方法抽取样本单位需要按照给定的入样概率通过一定的随机化程序来确定。当用样本统计量的值来估计总体参数值时,不仅要考虑样本观察值的特征,还要考虑其入样概率。在有的统计学教科书说抽取样本时都有相等的机会(概率)被抽中,
27、其实这句话是不准确的。在研究对象总体单位(抽样框)中抽取样本单位时,每个单位都有非零概率入样,因其规模及入样条件不同,其入样概率是不一样的,称之为不等概率抽样。概率抽样的特点之一就是根据入样概率,样本可以估计抽样误差,而不一定需要重复抽取不同的样本,进而对总体参数做出有一定概率保证程度的推断估计。现在学习的是第48页,共66页 1 1、抽签法、抽签法对N个总体单位,依次编上1N个号码及相应的号码签,对签进行均匀混合,依次从中逐个抽取几个签,则签上的号码即被抽中入样的样本单位。当N不大时(这时n也不大),这种方法较为适用,但对较大的N,这种方法不太方便。由于签上所编的号码各不相同,所以这是一种不
28、重复抽样,是一种等概率抽样。2 2、掷骰子法、掷骰子法 通常的骰子是一个六面体(如打麻将用的骰子),它只能产生16个数字,不能用来产生任意范围的随机数。随机数的骰子是由均匀材料制成的正20面体(每个面都是正三角形),其中有两个面标上09的数字,通过扔掷骰子或者在一个盒子里进行摇动,随机产生的骰子数即为入样的样本单位。现在学习的是第49页,共66页(二)纯随机抽样误差纯随机抽样的抽样误差在本章第二节已论及。(三)纯随机抽样地位和作用从理论上讲,纯随机抽样最符合概率抽样的原理,其他抽样都是在纯随机抽样的基础上发展起来的,评价其他抽样形式的效率,也是在与纯随机抽样比较的基础上进行的。纯随机抽样也有其
29、局限性。首先,从抽样实施的过程可以看出,要求每一个总体单位都要编码,这就要求有一个完整的抽样框,当N不是很大时,这容易办到,但N很大时,这并不容易办到。其次,如果这些样本很分散,即使能够找到这个样本并进行调查,但对研究目的而言代表性意义并不高。现在学习的是第50页,共66页(一)、含义:又称分层抽样。对总体各单位按一定标志加以分 组,然后从每一组中按随机原则抽取一定单位构成样本。(二)、类型:1、类型适宜抽样:根据抽样误差、标志差异确定抽样单 位数。(了解)2、类型比例抽样:根据统一的比例确定各组的样本数。(本书)k设总体分为 组,有按比例取样,即1212kknnnnNNNN12kNNNN12
30、knnnnknnkkknXXXXXXXXX12111212122212,得到样本如下:需要解决的问题是:如何求出抽样平均误差(即样本平均数的标准差)?现在学习的是第51页,共66页knnkkknXXXXXXXXX12111212122212:,样本kNNkkkNxxxxxxxxx12111212122212,总体:现在学习的是第52页,共66页knnkkknXXXXXXXXX12111212122212:,样本kNNkkkNxxxxxxxxx12111212122212,总体:现在学习的是第53页,共66页12212211122112,:,kkkknnnXXXXXXXXX样本122122111
31、22112,kNNkkkNxxxxxxxxx总体:现在学习的是第54页,共66页从类型抽样的抽样平均误差公式来看,类型抽样的抽样平均误差与组间方差无关,它决定于组内方差的平均水平。而方差的加法定理:,因此有如下结论:抽样效果一般来说好于简单随机抽样。因此在分组时应尽量扩大组间方差(组间差异),缩小组内方差(组内差异),从而减少抽样误差,提高抽样效果。(六)、作用 1、利用已知信息提高抽样效率 2、抽样的组织工作更便利 3、掌握总体中各子总体情况222i现在学习的是第55页,共66页(一)、含义:又称机械抽样或系统抽样。先按某个标志对总体单位进行排序,然后依固定的间隔来抽取样本单位。这样可以保证
32、样本单位均匀地分布在总体的各个部分,有较高的代表性。总体的单位数N,需要抽取的样本单位数n,则等距抽样的间隔大小:k=N/n()()()1212211121ikkkk iknknknk ink(二)、总体排序标志是由总体的有关辅助信息确定的,与调查标志两者间可以有关也可以无关。1、无关标志排队:如家计调查,按门牌号码排序。2、有关标志排队:如农产量调查按平均亩产量高低排序。一般来讲,有关标志排序要比无关标志排序的机械抽样更为优越。在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。以减少系统偏差的影响,提高样本的代表性。现在学习的是第56页,共66页1、无关标志排队时,为了方便起见,可以
33、采用简单随机抽样的平均误差代替等距抽样平均误差:2、有关标志排队法:用类型抽样的抽样平均误差公式计算误差(四)、作用1、简便易行2、机械抽样的误差大小与总体单位的顺序有关2211XnSnnNnN现在学习的是第57页,共66页(一)、定义:又称集团抽样。将总体各单位分为若干群,然后从中抽取部分群,对中选群的所有单位进行全面调查。(二)、作用 1、当总体缺乏包括全部总体单位的抽样框,无法进行抽 选时须采用整群抽样。2、比较方便和节约费用(三)、局限性:群内各单位之间的差异比较少,不同群之间则差异比较大,即抽样单位一样多时,整群抽样误差大(四)、群的种类:根据行政、地域以及自然形式的群体,连续总体时
34、,可由调查者根据需要来适当确定群的大小。NRMNRM设总体 个单位分为 群,每群包含个单位,即。r群Mn rM有现在学习的是第58页,共66页在计算抽样平均误差时假定每群单位数是相同的,但实际工作中,通常是“自然群”,其单位数一般是不等的。现在学习的是第59页,共66页1、含义:所谓阶段抽样,就是先从总体中抽出较大的范围的单位,再从中选的大单位中抽较小范围的单位,依次类推,最后从更小的范围抽出样本基本单位。阶段抽样一般应用于总体范围很大的情况。如在我国的农产量调查、职工家计调查中都很适用:先从全国抽出各个省,再从抽中的省中抽出县、市,最后抽出样本的基本单位等等。现在学习的是第60页,共66页
35、两阶段抽样较为简单。本书主要分析两阶段抽样平均误差的控制问题。两阶段抽样在组织技术上可以看成是整群抽样和类型抽样的结合。设总体分成R组,每组M个单位。两阶段抽样就是:第一阶段用整群抽样方式从总体的全部R组(群)中,随机抽取r组(群);第二阶段用类型抽样方式从每个中选组中抽出m样本单位。现在学习的是第61页,共66页现在学习的是第62页,共66页两阶段抽样的平均误差是由两部分构成的,第一部分是第一阶段从总体全部组抽部分组所引起的组间误差,第二部分是由第二阶段在中选组中抽部分单位所引起的组内平均误差。现在学习的是第63页,共66页1、进行抽样设计时需要考虑的两个问题:提高样本的代表性,增加抽样的效果。抽样要满足随机性要求。抽样设计时,要充分考虑如何降低抽样的成本费用。现在学习的是第64页,共66页1)抽样推断效果如何,依赖于所抽出样本的质量;样本的质量好坏,就看样本对总体的代表性如何,而这又依赖于抽取样本时的“随机性”。2)如果不满足随机性,则样本的代表性就值得怀疑,抽样推断就无从进行。现在学习的是第65页,共66页感谢大家观看现在学习的是第66页,共66页