等概率整群抽样.ppt

上传人:石*** 文档编号:47954978 上传时间:2022-10-04 格式:PPT 页数:74 大小:3.97MB
返回 下载 相关 举报
等概率整群抽样.ppt_第1页
第1页 / 共74页
等概率整群抽样.ppt_第2页
第2页 / 共74页
点击查看更多>>
资源描述

《等概率整群抽样.ppt》由会员分享,可在线阅读,更多相关《等概率整群抽样.ppt(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于等概率整群抽样关于等概率整群抽样现在学习的是第1页,共74页 一一、概概述述及及符符号号说说明明二二、单单阶阶段段抽抽样样三三、两两阶阶段段抽抽样样四四、抽抽样样设设计计五五、系系统统抽抽样样六六、基基于于模模型型推推理理现在学习的是第2页,共74页调查目的:调查含调查目的:调查含1000010000家住户的社区中住户拥有自行家住户的社区中住户拥有自行车数目;车数目;策略一:样本容量为策略一:样本容量为400400个住户的个住户的简单随机抽样简单随机抽样;策略二:策略二:整群抽样整群抽样。整群抽样步骤:。整群抽样步骤:1 1、将社区分为、将社区分为500500个组个组(每个组每个组2020

2、家住户家住户)从从500500个组个组中随机抽取中随机抽取2020个组个组(组组:初级抽样单元初级抽样单元PSU)PSU)2 2、从随机抽取、从随机抽取2020组中普查组内的每一家住户组中普查组内的每一家住户(住户住户:二级抽样单元二级抽样单元SSU)SSU)现在学习的是第3页,共74页注意:注意:1 1、抽样单元抽样单元(PSU)(PSU)不同于不同于观测单元观测单元(SSU);(SSU);2 2、同容量同容量的的整群整群抽样抽样观测单元提供的观测单元提供的信息少信息少于于SRS;SRS;3 3、花费花费而言,整群抽样更而言,整群抽样更物超所值物超所值;4 4、分群的原则是:分群的原则是:群

3、内差异尽可能大群内差异尽可能大,群间差,群间差异尽可能小。异尽可能小。p现在学习的是第4页,共74页 社区里一些组的住户主要是由家庭构成,他们拥有更多的自行车;而社区里另外一些组的居民主要是退休人员,他们的自行车较少。同一组里的20家住户不如随机选择的20户更能反映出社区的多样性。因此这因此这种情况下,整群抽样比同样规模的简单随机抽样的每种情况下,整群抽样比同样规模的简单随机抽样的每次观测所获得的信息可能更少。次观测所获得的信息可能更少。访问组中的20家住户比随机选择20家住户更节省经费,也更容易,所以整群抽样的单位美元花费可能产生更所以整群抽样的单位美元花费可能产生更多的信息。多的信息。现在

4、学习的是第5页,共74页 同一群中元素比整个总体中SRS选择的元素更趋于同质性同一品种的鱼在同一湖里更容易具有相同的汞浓度;同一疗养院的居民容易对护理质量具有相同意见。由于同质性存在,在一个群里调查所有成员,在一定程度上会造成信息重复,将导致对总体的估计不足,精度下降。为了使精度提高,分群的原则是:群分群的原则是:群内差异尽可能大,群间差异尽可能小内差异尽可能大,群间差异尽可能小。现在学习的是第6页,共74页(一)(一)定义(定义(WhatWhat)将将总总体体划划分分为为若若干干群群(psus)(psus),然然后后以以群群为为抽抽样样单单元元,从从总总体体中中随随机机抽抽取取一一部部分分群

5、群,对对被被选选群群内内的的所所有有或或部部分分单单元元(ssus)(ssus)进进行行调调查查的的一一种种抽抽样技术。样技术。一、概述及符号说明一、概述及符号说明现在学习的是第7页,共74页(二)特点(二)特点(Why)优点:优点:1 1、抽样框抽样框编制得以编制得以简化简化。2 2、实施调查、实施调查便利、节省费用便利、节省费用。不足:不足:抽样误差抽样误差较大。较大。现在学习的是第8页,共74页(三)整群抽样与分层抽样(三)整群抽样与分层抽样现在学习的是第9页,共74页现在学习的是第10页,共74页1、根据、根据行政行政或者或者地域地域;2、调查人员、调查人员人为人为确定。确定。1、与总

6、体各群规模、与总体各群规模相等相等;2、与总体各群规模、与总体各群规模不等不等。(四)群的划分(四)群的划分(五)群的规模(五)群的规模现在学习的是第11页,共74页(六)符号说明(六)符号说明 psus:初级抽样单元:初级抽样单元 ssus:次级抽样单元:次级抽样单元 :含有:含有N个个psu的总体的总体 S:N个个psu的总体中入样的的总体中入样的psus :psu中代表第中代表第i个入样的个入样的ssus :第:第i个个psu中的第中的第j个元素值个元素值现在学习的是第12页,共74页 总体总值总体总值 psu psu间的方差间的方差(总值总值)psu-总体指标总体指标 总体中总体中ps

7、uspsus的个数的个数 总体中第总体中第i i个个psupsu中中ssusssus的个数的个数 总体总体ssusssus的个数的个数 第第i i个个psupsu的总值的总值 现在学习的是第13页,共74页ssu-总体指标总体指标 总体均值总体均值 第第i i个个psupsu的总体均值的总体均值 总体方差总体方差 总体第总体第i i个个psupsu内内ssussu间方差间方差 现在学习的是第14页,共74页样本样本指标指标样本中样本中psuspsus的个数的个数样本中第样本中第i i个个psupsu中中ssusssus的个数的个数 第第i i个个psupsu中的样本均值中的样本均值 第第i i

8、个个psupsu总值的估计量总值的估计量 总体总值的无偏估计量总体总值的无偏估计量 样本样本psupsu间的方差间的方差 第第i i个个psupsu内内ssussu间的样本方差间的样本方差 第第i i个个psupsu中第中第j j个个ssussu样本权重样本权重现在学习的是第15页,共74页 单单阶阶段段整整群群抽抽样样只只能能选选择择群群中中的的所所有有元元素素入入样样,或或者者群群中中的的所所有有元元素素均均不不入入样样。跟跟二二阶阶段段抽抽样样相相比比,抽抽取取SSUSSU的的成成本本相相对对于于抽抽取取PSUPSU的的成成本本可可忽忽略略不不计计,通常会将选中群的所有通常会将选中群的所

9、有SSUSSU全部调查。全部调查。在在N N个个psupsu的的总总体体,第第i i个个psupsu中中包包含含 个个ssussus s。在在单单阶阶段段整整群群抽抽样样中中,被被选选中中的的群群psuspsus中中所所有有ssusssus全全都都入入样,即样,即 。二、单阶段抽样二、单阶段抽样现在学习的是第16页,共74页(一)群规模相等时的估计(一)群规模相等时的估计 总总体体N N个个群群中中,每每个个群群中中的的元元素素数数量量都都相相等等,即即有有 ,则则称称群群规规模模相相等等。将将群群的的总总值值看看成成是是观观测测值值,可可得得到到一一个个含含有有n n个个观观测测值值的的简简

10、单单随随机机样样本本 ,此此时时全全体体群群群群总总值值的的均均值值 。运运用用简简单单随随机机抽抽样样样样本本估估计计总总体体的的方方法法,求求出出总总体体的的总总值值。在在单单阶阶段段整整群群抽抽样样中中没没有有引引入入新新的的内内容容,我我们们利利用用了了简简单单随随机机抽抽样样的的结结果果,从从N N个个单单位位的的总总体体中中抽抽取取n n个个单单位位的的简简单单随随机机样样本本。这这里里我我们们把群总值看成是简单随机抽样中的观测值。把群总值看成是简单随机抽样中的观测值。现在学习的是第17页,共74页 在住户调查中估计两口之家的收入,则个体观测值在住户调查中估计两口之家的收入,则个体

11、观测值 为家庭为家庭i i中第中第j j个人的收入,而个人的收入,而 代表第代表第i i个家庭的总收入个家庭的总收入(是已知的,因为入样家庭的两个成员均已被调查是已知的,因为入样家庭的两个成员均已被调查),代表代表总体中每个家庭的平均收入,总体中每个家庭的平均收入,表示总体中每个人的平均表示总体中每个人的平均收入。收入。求总收入。求总收入。P170P170现在学习的是第18页,共74页 方差为:方差为:(5.2)(5.2)标准误为:标准误为:(5.3)(5.3)其其中中 和和 分分别别代代表表总总体体psupsu间间的的方方差差和和样样本本psupsu间的方差。间的方差。1 1、估计总收入、估

12、计总收入t t(总体总值总体总值):(5.1)现在学习的是第19页,共74页 (5.4)(5.5.5 5)(5.5.6 6)2 2、估计、估计总体中每个人的平均收入总体中每个人的平均收入 现在学习的是第20页,共74页 P171例5.2 一个学生想估计他所在宿舍楼里同学的绩点一个学生想估计他所在宿舍楼里同学的绩点(GPA)(GPA)的平均值。没有列出宿舍楼所有学生的名单再进的平均值。没有列出宿舍楼所有学生的名单再进行随机抽样行随机抽样,他发现宿舍区共有他发现宿舍区共有100100间套房间套房,每间有每间有4 4名名学生;他从中随机抽取了学生;他从中随机抽取了5 5间套房间套房,询问了其中每个询

13、问了其中每个人的人的GPAGPA。PSUPSU就是套房,就是套房,N=100N=100,n=5n=5,M=4M=4。总体总值估。总体总值估计就是整个宿舍楼所有学生的绩点。计就是整个宿舍楼所有学生的绩点。现在学习的是第21页,共74页总体总值估计总体总值估计(估计所有学生的绩点估计所有学生的绩点):):总体均值估计总体均值估计(估计所有学生的平均绩点估计所有学生的平均绩点):):=1130.4/400=2.826 样本方差样本方差:=2.256:=2.256 总体均值估计的标准误总体均值估计的标准误:=0.164 现在学习的是第22页,共74页在这里也可以使用权重在这里也可以使用权重 进行估计,

14、其中:进行估计,其中:=频率的倒数频率的倒数=1/P(i)*P(j|i)=1/P(i)*P(j|i)则可以的总体总值与均值的估计值分别为:则可以的总体总值与均值的估计值分别为:现在学习的是第23页,共74页(二)群规模相等时的理论二)群规模相等时的理论 表表5.1 5.1 整群抽样的总体整群抽样的总体ANOVA(ANOVA(方差分析方差分析)表表 由上式可以看出,整群抽样总值的总体方差完全由上式可以看出,整群抽样总值的总体方差完全依赖群间均方。依赖群间均方。现在学习的是第24页,共74页将上式带入将上式带入(5.2)(5.2)可得,可得,1 1阶整群抽样中,群规模相等时,总体总值阶整群抽样中,

15、群规模相等时,总体总值t t的无偏估计量的变异完全依赖于群间变异。的无偏估计量的变异完全依赖于群间变异。由于由于MSBMSB度量的是群之间的变化程度,当度量的是群之间的变化程度,当MSBMSB相对相对较大说明群间差异大较大说明群间差异大(不同群中的元素比相同群中的元不同群中的元素比相同群中的元素变化程度大素变化程度大)。如果。如果MSB/MSWMSB/MSW较大,则整群抽样就会较大,则整群抽样就会损失精度。损失精度。(5.7)现在学习的是第25页,共74页 对对比比整整群群抽抽样样与与SRSSRS,我我们们发发现现:如如果果 ,整群抽样比简单随机抽样效率要低。整群抽样比简单随机抽样效率要低。上

16、式为上式为n n个群个群(群中含群中含M M个元素个元素)的单阶段整群抽样的的单阶段整群抽样的总体总值无偏估计量的方差,下式为样本容量总体总值无偏估计量的方差,下式为样本容量nMnM的简的简单随机抽样总体总值的估计量的方差单随机抽样总体总值的估计量的方差现在学习的是第26页,共74页 对同一群内元素之间相似性的测量,它提供了一对同一群内元素之间相似性的测量,它提供了一种对群内同质性的测度方法。种对群内同质性的测度方法。ICC是皮尔逊相关系数的扩展,利用5.1的总体方差分析表知 因为 ,从(5.8)式得 如果群内元素完全相同,则如果群内元素完全相同,则SSW=0SSW=0,于是,于是ICC=1I

17、CC=1。(5.8)群内相关系数(群内相关系数(ICCICC)现在学习的是第27页,共74页 式子式子(5.8)(5.8)也可写成也可写成 采取整群抽样,我们将失去多少精度?采取整群抽样,我们将失去多少精度?如如果果N N足足够够大大,则则NM-1M(N-1)NM-1M(N-1),于于是是(5.(5.1010)式式中中方方差差之之比比近近似似为为1+(M-1)ICC1+(M-1)ICC,所所以以,简简单单随随机机抽抽样样中中1 1个个观观测测单单元元与与单单阶阶段段整整群群抽抽样样1+(M-1)ICC1+(M-1)ICC个个观观测测单单元元具具有有近近似相同量的信息似相同量的信息。(5.10)

18、(5.9)现在学习的是第28页,共74页 简单随机抽样中简单随机抽样中1 1个观测单元与单阶段整群个观测单元与单阶段整群抽样抽样1+(M-1)ICC1+(M-1)ICC个观测单元具有近似相同量的个观测单元具有近似相同量的信息。信息。当当M=5,ICC=0.5,M=5,ICC=0.5,得到得到1+(M-1)ICC=3,1+(M-1)ICC=3,也就也就是我们需要利用整群样本测量是我们需要利用整群样本测量300300个元素以获得个元素以获得含含100100个元素的简单随机样本相同的精度个元素的简单随机样本相同的精度。现在学习的是第29页,共74页30 ICC ICC何时取正、取负?何时取正、取负?

19、1.1.ICCICC为群内元素的相似性提供了度量。如果群内元素相似,为群内元素的相似性提供了度量。如果群内元素相似,ICCICC为正,同时为正,同时SSWSSW将相对于将相对于SSTOSSTO较小且较小且ICCICC相对较大。当相对较大。当ICCICC为正时,为正时,整群抽样与简单随机抽样效率低。整群抽样与简单随机抽样效率低。2.2.如果总体中的群是自然产生的,则如果总体中的群是自然产生的,则ICCICC通常为正。同一群内的元素处通常为正。同一群内的元素处于相同的环境于相同的环境具有同等水平的农药量、同一程度的发病率、同样具有同等水平的农药量、同一程度的发病率、同样的政治观点。的政治观点。3.

20、3.如果群内的元素比简单随机抽样的元素更分散,则如果群内的元素比简单随机抽样的元素更分散,则ICCICC是负值。是负值。这就使得群均值近似相等这就使得群均值近似相等因为因为SSTO=SSW+SSBSSTO=SSW+SSB,若,若SSTOSSTO一定且一定且SSWSSW很大,则很大,则SSBSSB必定很小。如果必定很小。如果ICC0ICC 系系统抽样统抽样SRSSRS。现在学习的是第65页,共74页 周期性模式样本框:当总体以循环或周期性次序排列,而周期性模式样本框:当总体以循环或周期性次序排列,而抽样的间隔恰好是周期的倍数时,系统抽样最危险。假定总体抽样的间隔恰好是周期的倍数时,系统抽样最危险

21、。假定总体取值取值(按次序排列为按次序排列为)1 2 3 1 2 3 1 2 3 1 2 3 1 2 3)1 2 3 1 2 3 1 2 3 1 2 3 1 2 3,抽样间隔为抽样间隔为3 3,则系统样本中所有元素都是相同的。得到的方差,则系统样本中所有元素都是相同的。得到的方差为为0 0,而真实的方差为,而真实的方差为2/32/3。当研究人员想要获得总体的代表性样本、而又没有任何先当研究人员想要获得总体的代表性样本、而又没有任何先验的资源来构造抽样框时,往往会采用系统抽样的方法。在采验的资源来构造抽样框时,往往会采用系统抽样的方法。在采用系统抽样的很多情形中,系统样本都可以作为用系统抽样的很

22、多情形中,系统样本都可以作为SRSSRS样本加以处样本加以处理。理。现在学习的是第66页,共74页5.6 5.6 整群抽样中基于模型的推理整群抽样中基于模型的推理 随机效果的方差模型为整群抽样提供了一个基本结构:随机效果的方差模型为整群抽样提供了一个基本结构:其中其中 是服从均值为是服从均值为0,方差为,方差为 的分布。的分布。是服从均是服从均值为值为0,方差为,方差为 的分布。且所有的的分布。且所有的 和和 都是相互都是相互独立的。独立的。(5.34)(5.34)现在学习的是第67页,共74页 可知模型可知模型 意味着一个群的总期望值随着群内元素数目的意味着一个群的总期望值随着群内元素数目的

23、增加而线性增加。增加而线性增加。模型模型 的群内相关系数被定义为的群内相关系数被定义为 让让 ,可得,可得 容易看出容易看出 模型中模型中 的取值总是正值的取值总是正值,与与ICCICC可以取可以取负值不同负值不同,所以用模型所以用模型M1M1描述数据描述数据,相同样本下整群估计必然相同样本下整群估计必然比简单抽样效率低比简单抽样效率低。(5.9)(5.7)(5.7)现在学习的是第68页,共74页 对模型对模型M1M1做线性估计量为做线性估计量为:其中其中 为常数为常数,总体总值为总体总值为:则偏差为则偏差为5.6.15.6.1用模型进行估计用模型进行估计现在学习的是第69页,共74页由上式可

24、知当由上式可知当 时时,是无偏估计量是无偏估计量,这时方差为这时方差为:(5.36):(5.36)现在学习的是第70页,共74页基于设计的估计量情形:基于设计的估计量情形:代表无偏估计量的随机变量:代表无偏估计量的随机变量:由抽样权数可知:由抽样权数可知:,是抽样的权重,是抽样的权重,有:有:所以可知基于模型所以可知基于模型M1M1的估计偏差为的估计偏差为:现在学习的是第71页,共74页 对于比估计系数为对于比估计系数为 ,其,其估计值为:估计值为:则有:则有:所以比估计值是基于模型所以比估计值是基于模型M1M1的无偏估计,如果的无偏估计,如果对任意群对任意群i i有有 和和 ,则偏差为,则偏差为现在学习的是第72页,共74页 总结:整群抽样一般用于大型调查,但是通常由总结:整群抽样一般用于大型调查,但是通常由整群样本得到的估计结果的方差都大于同容量的整群样本得到的估计结果的方差都大于同容量的SRSSRS的方差,但是整群抽样的单位费用支出可以提供更高的方差,但是整群抽样的单位费用支出可以提供更高的精度。的精度。本章关于等概率整群抽样的所有公式都是规模不相本章关于等概率整群抽样的所有公式都是规模不相等的等的2 2阶整群抽样一般结果的特殊公式情形。阶整群抽样一般结果的特殊公式情形。现在学习的是第73页,共74页2022/10/4感谢大家观看现在学习的是第74页,共74页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁