第四章整群抽样课件.ppt

上传人:飞****2 文档编号:69542583 上传时间:2023-01-06 格式:PPT 页数:93 大小:2.29MB
返回 下载 相关 举报
第四章整群抽样课件.ppt_第1页
第1页 / 共93页
第四章整群抽样课件.ppt_第2页
第2页 / 共93页
点击查看更多>>
资源描述

《第四章整群抽样课件.ppt》由会员分享,可在线阅读,更多相关《第四章整群抽样课件.ppt(93页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章第四章 整群抽样整群抽样4.1 引言引言4.2 群规模相等时的估计群规模相等时的估计4.3 总体比例的估计总体比例的估计1/6/20231/6/20231 1第一节第一节 引言引言一一.整群抽样的定义与特点整群抽样的定义与特点(一一)定义定义 整群抽样(整群抽样(cluster sampling)或集团或集团抽样抽样,是将总体划分为若干群,然后以群为是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,抽样单元,从总体中随机抽取一部分群,对中选群中的所有基本单元进行调查的一对中选群中的所有基本单元进行调查的一种抽样技术。种抽样技术。1/6/20231/6/20232 2【例

2、例1 1】对某校的学生对某校的学生思想或身体情况思想或身体情况进行调查进行调查:某校学生某校学生 学生宿舍学生宿舍 宿舍学生宿舍学生 估计某居民区现有的电话拥有率估计某居民区现有的电话拥有率 全体居民全体居民 若干幢楼若干幢楼 居民居民【例2】某地小学生的视力状况进行调查【例3】某地小学生某所小学小学生1/6/20231/6/20233 3 整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥梁。此章介绍的是单阶段整群抽样。梁。此章介绍的是单阶段整群抽样。梁。此章介绍的是单阶段整群抽样。

3、梁。此章介绍的是单阶段整群抽样。注注注注:多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。(二二二二)特点特点特点特点 1.1.抽样框编制得以简化。抽样框编制得以简化。抽样框编制得以简化。抽样框编制得以简化。在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而

4、整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。因此因此因此因此,在缺少基本单元名单在缺少基本单元名单在缺少基本单元名单在缺少基本单元名单,但群有现成的但群有现成的但群有现成的但群有现成的名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。1/6/20231/6/20234 4【例例例例】某市有某市有某市有某市有100100100100所小学共所小学共所小学共所小学共50,00050,00050,00

5、050,000名学生名学生名学生名学生,要从中抽要从中抽要从中抽要从中抽2000200020002000名学名学名学名学生显然是困难的生显然是困难的生显然是困难的生显然是困难的,而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学,再对抽再对抽再对抽再对抽中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了.【例例例例】调查农村居民住户,不必列出农村所有居民住户的抽调查农村居民住户,不必列出农村所有居民住户的抽调查农村居民住户,不必列出农村所有居民住户

6、的抽调查农村居民住户,不必列出农村所有居民住户的抽样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。即使具备总体基本单元的名单即使具备总体基本单元的名单即使具备总体基本单元的名单即使具备总体基本单元的名单,能直接抽取能直接抽取能直接抽取能直接抽取,但总体基本单元在空间上的分

7、布面很广但总体基本单元在空间上的分布面很广但总体基本单元在空间上的分布面很广但总体基本单元在空间上的分布面很广,那么选定那么选定那么选定那么选定调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实地观测调查费用则很高地观测调查费用则很高地观测调查费用则很高地观测调查费用则很高,并需要较长的时间。并需要较长的时间。并需要较长的时间。并需要较长的时间。2.2.实施调查便利,节省费用实施调查便利,节省费用实施调查便利,节省费用实施调查便利,节省费用。1/6/20231/6/20235

8、5 对于整群抽样对于整群抽样对于整群抽样对于整群抽样,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组织实施过程更加便利,同时还可以大大地节省调织实施过程更加便利,同时还可以大大地节省调织实施

9、过程更加便利,同时还可以大大地节省调织实施过程更加便利,同时还可以大大地节省调查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采用整群抽样方法。用整群抽样方法。用整群抽样方法。用整群抽样方法。1/6/20231/6/20236 6 例如,在进行农村居民户收入情况调查时,在一例如,在进行农村居民户收入情况调查时,在

10、一例如,在进行农村居民户收入情况调查时,在一例如,在进行农村居民户收入情况调查时,在一个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及费用。费用

11、。费用。费用。1/6/20231/6/20237 7整群抽样的随机性整群抽样的随机性体现在群与群间不体现在群与群间不重叠,也无遗漏,总体任何一个基本单元重叠,也无遗漏,总体任何一个基本单元都必须且只能归于某一群都必须且只能归于某一群,群的抽选按概率群的抽选按概率确定。确定。如果把每一个群看作一个单位,则整群如果把每一个群看作一个单位,则整群抽样可以被理解为是一种抽样可以被理解为是一种特殊的简单随机特殊的简单随机抽样抽样。理解这一点对给出整群抽样的估计。理解这一点对给出整群抽样的估计量的方差有帮助量的方差有帮助.整群抽样也整群抽样也是多阶段抽样的前提和基是多阶段抽样的前提和基础。础。1/6/20

12、231/6/20238 8整群抽样有特殊的用途。整群抽样有特殊的用途。整群抽样有特殊的用途。整群抽样有特殊的用途。有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,进行整群抽样,才能满足调查的目的。进行整群抽样,才能满足调查的目的。进行整群抽样,才能

13、满足调查的目的。进行整群抽样,才能满足调查的目的。例例例例1:1:人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有通过对一定地理区域通过对一定地理区域通过对一定地理区域通过对一定地理区域(如省如省如省如省,市市市市,县县县县,街道等街道等街道等街道等)内的人口群体内的人口群体内的人口群体内的人口群体作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行

14、。类似地诸如人口出生率、流动率等调查都需要采用整群抽样。都需要采用整群抽样。都需要采用整群抽样。都需要采用整群抽样。例例例例2:2:对某地人口性别比例的调查对某地人口性别比例的调查对某地人口性别比例的调查对某地人口性别比例的调查,以家庭作为群比直接抽以家庭作为群比直接抽以家庭作为群比直接抽以家庭作为群比直接抽取个人进行估计精度要高取个人进行估计精度要高取个人进行估计精度要高取个人进行估计精度要高,因为家庭的结构基本相似。因为家庭的结构基本相似。因为家庭的结构基本相似。因为家庭的结构基本相似。整群抽样要求分群后各群所含次级单元数目应该确知,整群抽样要求分群后各群所含次级单元数目应该确知,整群抽样

15、要求分群后各群所含次级单元数目应该确知,整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。否则会给抽样推断带来不便。否则会给抽样推断带来不便。否则会给抽样推断带来不便。1/6/20231/6/20239 9缺点缺点:整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精度比起简单随机抽样来要低

16、一些。度比起简单随机抽样来要低一些。度比起简单随机抽样来要低一些。度比起简单随机抽样来要低一些。例如,在一个有例如,在一个有例如,在一个有例如,在一个有500500个村庄、个村庄、个村庄、个村庄、100000100000个农户的县,个农户的县,个农户的县,个农户的县,抽取抽取抽取抽取1 1的农户就是的农户就是的农户就是的农户就是10001000户,而抽户,而抽户,而抽户,而抽1 1的村庄则只的村庄则只的村庄则只的村庄则只有有有有5 5个村庄,也许抽到的个村庄,也许抽到的个村庄,也许抽到的个村庄,也许抽到的5 5个村庄农户多于个村庄农户多于个村庄农户多于个村庄农户多于10001000,但由于样本

17、单位只集中在但由于样本单位只集中在但由于样本单位只集中在但由于样本单位只集中在5 5个村庄,显然不如在全个村庄,显然不如在全个村庄,显然不如在全个村庄,显然不如在全县范围内简单随机抽取县范围内简单随机抽取县范围内简单随机抽取县范围内简单随机抽取10001000户分布均匀,代表性户分布均匀,代表性户分布均匀,代表性户分布均匀,代表性一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。1/6/20231/6/20231010当然,由于整群抽样省时省力,每个单元当然,由于整群抽样省时省力,每个单元的平均调查费用较少,我们可以通过多抽的平均调

18、查费用较少,我们可以通过多抽几个群,适当增大样本量的方法弥补估计几个群,适当增大样本量的方法弥补估计精度的损失。精度的损失。1/6/20231/6/20231111 二二.群的划分群的划分 1.根据行政或地域形成的群体;如:村庄、城镇、一片森林等 2.调查人员人为确定的;对可控制规模的群,群规模不宜过大对可控制规模的群,群规模不宜过大1/6/20231/6/20231212分群的原则分群的原则:划分群时应使划分群时应使群内方差尽可能大群内方差尽可能大,群间方差群间方差尽可能小尽可能小。(注意:这一点与分层抽样中。(注意:这一点与分层抽样中总体内层的划分有着极大的差别)总体内层的划分有着极大的差

19、别)这意味着每个群均具有足够的代表性。如这意味着每个群均具有足够的代表性。如果划分的群相互之间颇多相似之处,那么果划分的群相互之间颇多相似之处,那么少量群的抽取足以提供良好的精度。少量群的抽取足以提供良好的精度。1/6/20231/6/20231313分析分析分析分析:整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查,对于被抽中群对于被抽中群对于被抽中群对于被抽中群内基本单元而言则是全面调查内基本单元而言则是全面调查内基本单元而言则是全面调查内基本单元而言则是全面调查,是是是是“先部分先部分先部分先部分,后全体后全体后全体

20、后全体”的抽样组织形式的抽样组织形式的抽样组织形式的抽样组织形式,与分层抽样正好相反。根据方与分层抽样正好相反。根据方与分层抽样正好相反。根据方与分层抽样正好相反。根据方差分析原理,当总体划分为群后差分析原理,当总体划分为群后差分析原理,当总体划分为群后差分析原理,当总体划分为群后,总体方差可以分总体方差可以分总体方差可以分总体方差可以分解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此消彼长的关系。由于整群抽样是对入选群中的所消彼长的关系。由于整群抽样是对入选群中的所消彼长的

21、关系。由于整群抽样是对入选群中的所消彼长的关系。由于整群抽样是对入选群中的所有单元都进行调查有单元都进行调查有单元都进行调查有单元都进行调查,因此因此因此因此影响整群抽样误差的主要影响整群抽样误差的主要影响整群抽样误差的主要影响整群抽样误差的主要是群间方差是群间方差是群间方差是群间方差。为了提高整群抽样估计的精度为了提高整群抽样估计的精度为了提高整群抽样估计的精度为了提高整群抽样估计的精度,划分划分划分划分群时应使群内方差尽可能大群时应使群内方差尽可能大群时应使群内方差尽可能大群时应使群内方差尽可能大,群间方差尽可能小。群间方差尽可能小。群间方差尽可能小。群间方差尽可能小。1/6/20231/

22、6/20231414群间相似 群间差异较大1/6/20231/6/20231515 三三.群的规模群的规模 即组成群的单元的数量。即组成群的单元的数量。整群抽样中,如何有效地对群的大小进整群抽样中,如何有效地对群的大小进行计量,直接关系到抽样估计效率的高低。行计量,直接关系到抽样估计效率的高低。研究表明,对群的大小的最优计量尺度是各研究表明,对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。但在实群在所研究标志上的标志总量大小。但在实际工作中,它是未知的。因此通常选择与所际工作中,它是未知的。因此通常选择与所研究标志高度线性相关的另一辅助标志作为研究标志高度线性相关的另一辅助标志作为

23、计量尺度。计量尺度。1/6/20231/6/20231616注注:整群抽样与分层抽样的的比较整群抽样与分层抽样的的比较二者在分组(层或群)的条件、调查的方二者在分组(层或群)的条件、调查的方式、分组(层或群)的目的、分组(层或式、分组(层或群)的目的、分组(层或群)的原则、总体方差的分解等方面都存群)的原则、总体方差的分解等方面都存在着较为明显的差别。在着较为明显的差别。1/6/20231/6/20231717 群的规模大群的规模大,估计的精度差但费用省估计的精度差但费用省;群群的规模小的规模小,估计的精度高但费用增大。估计的精度高但费用增大。通常我们面临的总体会有自然的初级单元,通常我们面临

24、的总体会有自然的初级单元,通常我们面临的总体会有自然的初级单元,通常我们面临的总体会有自然的初级单元,例如各所例如各所例如各所例如各所中学中学中学中学它们互相之间它们互相之间它们互相之间它们互相之间关于学生的体质关于学生的体质关于学生的体质关于学生的体质很很很很相似,但在一个学校里每个相似,但在一个学校里每个相似,但在一个学校里每个相似,但在一个学校里每个学生学生学生学生之间有一定的之间有一定的之间有一定的之间有一定的差异。差异。差异。差异。倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑到组织管理

25、上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用的多少等因素。的多少等因素。的多少等因素。的多少等因素。1/6/20231/6/20231818当各群所含次级单元数相等时,就称群的当各群所含次级单元数相等时,就称群的大小相等;当各群所含次级单元数不相等大小相等;当各群所含次级单元数不相等时,就称群的大小不相等。时,就称群的大小不相等。当群的大小接近时,常采用简单随机抽样当群的大小接近时,常采用简单随机抽样抽取群;当群的大小相差比较大时,为提抽取群;当群的大小相差比较大时,为提高效率则更多地采用

26、不等概率(按与群的高效率则更多地采用不等概率(按与群的大小成比例的概率抽样)方法。大小成比例的概率抽样)方法。1/6/20231/6/20231919第二节第二节 群规模相等时的估计群规模相等时的估计一.符号说明 总体有N个群,每个群包含的单元数M相等(或相近)。符号:总体群数:N 样本群数:n 总体第 i 群中第 j 个单元的指标值:样本第 i 群中第 j 个单元的指标值:第 i 群中的单元数:1/6/20231/6/20232020总体中单元总数:总体中第 i 群的群总值:样本中第 i 群的群总值:总体中第 i 群的个体均值:1/6/20231/6/20232121样本中第 i 群的个体均

27、值:总体中的群均值:样本中的群均值:总体中的个体均值:1/6/20231/6/20232222样本中的个体均值:总体方差:总体群间方差:1/6/20231/6/20232323总体群内方差总体群内方差:样本方差样本方差:样本群间方差样本群间方差:样本群内方差样本群内方差:1/6/20231/6/20232424 总体ANOVA(方差分析)表-群规模相等的整群抽样来源来源自由度自由度 平方和平方和 均方均方群间群间群内群内 N-1 N-1 N N(M-1M-1)总计总计NM-1NM-11/6/20231/6/20232525二二.估计量估计量 整群抽样是以群为单位进行抽样,如果群的抽取是简单随机

28、的,则当群的大小都相等时,可以将简单随机抽样理解为是一种特殊的整群抽样,特别当总体分群后的每个群都只包括一个次级单元时,整群抽样和简单随机抽样一致。因此,整群抽样的估计量可以比照简单随机抽样方式来构造。1/6/20231/6/20232626(一一)均值估计量的定义均值估计量的定义 在群的抽取是简单随机的在群的抽取是简单随机的,且群的且群的大小大小(M)相等相等,则总体均值的估计为则总体均值的估计为:1/6/20231/6/20232727(二)估计量 的性质性质性质1 是 的无偏估计.性质2 的方差为:1/6/20231/6/20232828证明证明:因为因为 ,则则1/6/20231/6/

29、20232929总体总值总体总值 的估计量及相应的方差为的估计量及相应的方差为:性质性质3 的样本估计为的样本估计为:1/6/20231/6/20233030三、整群抽样效率分析三、整群抽样效率分析整群抽样的估计精度与群内相关系数整群抽样的估计精度与群内相关系数整群抽样的估计精度与群内相关系数整群抽样的估计精度与群内相关系数 有关。有关。有关。有关。分子可写成:1/6/20231/6/20233131分母可写分母可写分母可写分母可写 成成成成:于是于是于是于是 又可以写成又可以写成又可以写成又可以写成:1/6/20231/6/20233232 的方差可以用群内相关系数近似表示的方差可以用群内相

30、关系数近似表示:(当N-1=N,NM-1=NM时)1/6/20231/6/20233333其中:其中:1/6/20231/6/20233434若采用简单随机抽样若采用简单随机抽样若采用简单随机抽样若采用简单随机抽样,则样本均值则样本均值则样本均值则样本均值 的方差为的方差为的方差为的方差为:等群抽样的设计效应为等群抽样的设计效应为等群抽样的设计效应为等群抽样的设计效应为:说明整群抽样的方差约为简单随机抽样方差的说明整群抽样的方差约为简单随机抽样方差的说明整群抽样的方差约为简单随机抽样方差的说明整群抽样的方差约为简单随机抽样方差的 倍倍倍倍.1/6/20231/6/20233535另外另外,群内

31、相关系数也可以用群内方差群内相关系数也可以用群内方差 和群间方差和群间方差 表示表示:1/6/20231/6/20233636证明:证明:因为因为 而而 于是于是(1)1/6/20231/6/20233737 当当N N很大很大,而,而MM相对于相对于NMNM很小,很小,NM-1 NM-MNM-1 NM-M,则上式可写成:则上式可写成:又因为又因为(2)(3)总离差的分解群间方差群内方差1/6/20231/6/20233838则则 将其代入(将其代入(1 1),(),(2 2)式,便有)式,便有 由(由(3 3)式)式(4)(5)1/6/20231/6/20233939因为因为 是是 的无偏估

32、计,的无偏估计,是是 的无偏估计,故的无偏估计,故由(由(6 6)、()、(2 2)或()或(5 5)式整理得)式整理得 N很大时 (6)1/6/20231/6/20234040整群抽样的估计效率整群抽样的估计效率,与群内相关系数与群内相关系数 关关系密切。系密切。如果群内各单元的值都相等如果群内各单元的值都相等,则群内方则群内方差等于零差等于零,此时此时 为最大值为最大值,deff=M,即整群抽样的估计量方差是简单随机抽样即整群抽样的估计量方差是简单随机抽样估计量的方差的估计量的方差的M倍倍;若群内方差与总体方差相等若群内方差与总体方差相等,意味着分意味着分群是完全随机的群是完全随机的,此时

33、此时,deff=1,整群抽样与简单随机抽样估计效率相同整群抽样与简单随机抽样估计效率相同;当群内方差大于总体方差时当群内方差大于总体方差时,为负值为负值,deff1,整群抽样的效率高于简单随机抽整群抽样的效率高于简单随机抽样。样。1/6/20231/6/20234141 当群间方差等于当群间方差等于当群间方差等于当群间方差等于0,0,即各群均值即各群均值即各群均值即各群均值 都相等时都相等时都相等时都相等时,有极小值有极小值有极小值有极小值 ,所以所以所以所以 的取值范围是的取值范围是的取值范围是的取值范围是 。当当 1时,时,deffM 当当 0时,时,deff1 当当 为负时,为负时,de

34、ff1 1/6/20231/6/20234242【例例】在一次对某寄宿中学在校生零化钱在一次对某寄宿中学在校生零化钱的调查中的调查中,以寄宿作为群进行整群抽样。每以寄宿作为群进行整群抽样。每个宿舍有个宿舍有6 6名学生。用简单随机抽样在全部名学生。用简单随机抽样在全部315315间宿舍中抽取间宿舍中抽取 n=8n=8间宿舍。全部间宿舍。全部4848个学个学生上周每人的零化钱生上周每人的零化钱 及相关计算数据如及相关计算数据如下页表下页表,试估计该学校平均每个学生每周的试估计该学校平均每个学生每周的零化钱零化钱 ,并给出其并给出其95%95%的置信区间。的置信区间。1/6/20231/6/202

35、343438个宿舍个宿舍48名学生每周名学生每周零化钱零化钱支出额支出额(元元)宿舍宿舍宿舍宿舍1 1宿舍宿舍宿舍宿舍2 2宿舍宿舍宿舍宿舍3 3宿舍宿舍宿舍宿舍4 4宿舍宿舍宿舍宿舍5 5宿舍宿舍宿舍宿舍6 6宿舍宿舍宿舍宿舍7 7宿舍宿舍宿舍宿舍8 8学生学生学生学生1 15858919112312399991101101111111201209696学生学生学生学生2 283838383898910510599991001001151158080学生学生学生学生3 374747979949498981321321161161171176363学生学生学生学生4 4828211111110

36、9109107107878799999999130130学生学生学生学生5 5666610110179791291299999107107106106105105学生学生学生学生6 6878769698080909012412410510512012086867575898995.6795.67104.67104.67108.5108.5106.33106.33112.83112.8393.3393.33125.6125.6233.6233.6299.07299.07177.87177.87287.5287.542.2742.2772.5772.57527.87527.871/6/20231/

37、6/20234444解解:N=315 n=8 M=6 f=n/N=0.0254:N=315 n=8 M=6 f=n/N=0.02541/6/20231/6/20234545置信区间:【例例】估计上例中宿舍为群的群内相关系数与设计效应。1/6/20231/6/202346461/6/20231/6/20234747 deff =1+(M-1)=1+(6-1)0.348256=2.741若采用简单随机抽样,其样本量为:1/6/20231/6/20234848 【练习题练习题练习题练习题】在一次某城市居民小区居民食品消费量在一次某城市居民小区居民食品消费量在一次某城市居民小区居民食品消费量在一次某城

38、市居民小区居民食品消费量调查中,以每个楼层(相当于居民小组)为群进调查中,以每个楼层(相当于居民小组)为群进调查中,以每个楼层(相当于居民小组)为群进调查中,以每个楼层(相当于居民小组)为群进行整群抽样。每个楼层都有行整群抽样。每个楼层都有行整群抽样。每个楼层都有行整群抽样。每个楼层都有M=8M=8个住户。用简单个住户。用简单个住户。用简单个住户。用简单随机抽样在全部随机抽样在全部随机抽样在全部随机抽样在全部N=510N=510个楼层中抽取个楼层中抽取个楼层中抽取个楼层中抽取n=12n=12个楼层。个楼层。个楼层。个楼层。全部全部全部全部9696个样本户人均月食品消费额个样本户人均月食品消费额

39、个样本户人均月食品消费额个样本户人均月食品消费额y yij ij及按楼层的及按楼层的及按楼层的及按楼层的平均数平均数平均数平均数 与标准差与标准差与标准差与标准差s si i如下表所示。试估计该居民如下表所示。试估计该居民如下表所示。试估计该居民如下表所示。试估计该居民小区人均食品消费额的户平均值,并给出其小区人均食品消费额的户平均值,并给出其小区人均食品消费额的户平均值,并给出其小区人均食品消费额的户平均值,并给出其95%95%的置信区间,的置信区间,的置信区间,的置信区间,计算群内相关系数与设计效应计算群内相关系数与设计效应计算群内相关系数与设计效应计算群内相关系数与设计效应1/6/202

40、31/6/202349491212个楼层个楼层9696户居民人均月食品消费额资料户居民人均月食品消费额资料i iy yij ijs si i1 12 23 34 45 56 67 78 89 9101011111212240,187,162,185,206,197,154,173240,187,162,185,206,197,154,173210,192,184,148,186,175,169,180210,192,184,148,186,175,169,180149,168,145,130,170,144,125,167149,168,145,130,170,144,125,167202,1

41、87,166,232,205,263,198,210202,187,166,232,205,263,198,210210,285,308,198,264,275,183,231210,285,308,198,264,275,183,231394,256,192,280,267,334,216,289394,256,192,280,267,334,216,289192,121,172,165,152,224,195,241192,121,172,165,152,224,195,241230,205,187,176,212,253,189,240230,205,187,176,212,253,18

42、9,240274,208,195,307,264,258,210,309274,208,195,307,264,258,210,309232,187,150,182,175,212,169,222232,187,150,182,175,212,169,222342,294,267,309,258,198,244,286342,294,267,309,258,198,244,286228,294,182,312,267,254,232,298228,294,182,312,267,254,232,298188.00188.00180.50180.50149.75149.75207.875207.

43、875244.25244.25278.50278.50182.75182.75211.50211.50253.125253.125191.125191.125274.75274.75258.375258.37527.1927.1917.9817.9817.3217.3229.1729.1745.2045.2063.8763.8738.7738.7727.4827.4844.5244.5228.2928.2943.7043.7043.5243.521/6/20231/6/20235050解:解:已知已知N510,n12,M8,fn/N=0.0235故故1/6/20231/6/20235151于是

44、于是于是于是 的置信度为的置信度为的置信度为的置信度为9595的置信区间为的置信区间为的置信区间为的置信区间为也即也即也即也即1/6/20231/6/20235252例例例例2 2 由例由例由例由例1 1数据,计算群内相关系数与设计效应数据,计算群内相关系数与设计效应数据,计算群内相关系数与设计效应数据,计算群内相关系数与设计效应解:由前已算出样本群间方差解:由前已算出样本群间方差解:由前已算出样本群间方差解:由前已算出样本群间方差 而群内方差而群内方差而群内方差而群内方差为为为为1/6/20231/6/202353531/6/20231/6/20235454若若 令令为为简单随机抽样的样本量

45、简单随机抽样的样本量则则则则即可达到整群抽样即可达到整群抽样即可达到整群抽样即可达到整群抽样9696户样本量相同的估计精度户样本量相同的估计精度户样本量相同的估计精度户样本量相同的估计精度1/6/20231/6/20235555第三节第三节 群规模不等的估计群规模不等的估计 一、等概抽样一、等概抽样一、等概抽样一、等概抽样,简单估计简单估计简单估计简单估计 条件条件条件条件:群之间的规模差异相差不很大群之间的规模差异相差不很大群之间的规模差异相差不很大群之间的规模差异相差不很大 对总体均值对总体均值 的估计为的估计为:的方差估计为:当群Mi规模不等时,有不同的抽取方法和估计方法1/6/2023

46、1/6/20235656此法特点1.估计量 是有偏的2.操作简便,易于掌握和使用3.适用条件,群之间的规模差异不大时1/6/20231/6/20235757二、等概抽样二、等概抽样,加权估计加权估计思路思路:以群规模以群规模MMi i为权数为权数,乘以各群均值乘以各群均值 得到群观察值总和得到群观察值总和 y yi i.再将样本中再将样本中 n n个群的总和平个群的总和平 均均,求得群总和均值求得群总和均值 ,再除以群平均规模再除以群平均规模 ,求得均值估计求得均值估计 .1/6/20231/6/20235858如果总体平均规模 未知,可以用样本平均规模 代替.1/6/20231/6/2023

47、5959 总体的总量Y的估计:或 为总体中的个体单元总数.方差:1/6/20231/6/20236060它的无偏估计为它的无偏估计为:均值的方差均值的方差:1/6/20231/6/20236161 特点特点:此种方法由于考虑了群规模,所以估计量 是无偏估计量。在估计精度方面,如果群规模差别很大时,该方法与前一种方法相比没有明显改观。三、等概抽样三、等概抽样,比率估计比率估计 该种方法适合大样本量情况。该种方法适合大样本量情况。总体均值总体均值:这里辅助变量不这里辅助变量不 是是X Xi i而是群规模而是群规模MMi i1/6/20231/6/20236262 它是一个有偏估计。当样本群数n 很

48、大时,其偏倚很小,可以忽略不计。总体总值Y的比率估计为:1/6/20231/6/20236363 估计量的方差分别是:估计量的方差分别是:对比1/6/20231/6/20236464 由方差公式可以看出,估计量 的方差取决于群的个体均值 的差异。所以,尽管群的规模 差异可能很大,但 之间的差异比 之间的差异要小得多。因此,与前一种方法相比,在大样本量情况下,比率估计的精度要更高一些。的样本估计分别为:1/6/20231/6/20236565及 1/6/20231/6/20236666 四、方法比较四、方法比较【例例】某县有3333个乡,共726726个村,该年度某农作物种植面积为3052530

49、525亩。(见下表)现采用等概抽样随机抽取1010个乡进行该种农作物的产量调查,根据下面的资料估计全县总产量以及估计量标准差,并对上述方法进行比较分析。1/6/20231/6/20236767样本乡样本乡编号编号村庄数村庄数农作物总产量(乡)农作物总产量(乡)y yi i(万公斤)万公斤)种植面积(乡)种植面积(乡)x xi i(亩)亩)1 1151522228008001.46671.46672 2181822.822.87807801.26671.26673 3262630.230.2100010001.16151.16154 4141421.721.77007001.551.555 52

50、02025.325.38808801.2651.2656 6282831.231.2110011001.11431.11437 7212126268508501.23811.23818 8191920.520.58008001.0791.0799 9313133.833.8120012001.09031.09031010171723.623.68308301.38821.3882合计合计209209257.1257.189408940_ _1/6/20231/6/20236868解解:1、用等概抽样,简单估计:用等概抽样,简单估计:平均每个村的产量为:=726*1.262=916.212(万公

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁