《抽样技术其他专题精选PPT.ppt》由会员分享,可在线阅读,更多相关《抽样技术其他专题精选PPT.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样技术 其他专题第1页,此课件共46页哦2 n以前各章基本假设总体单元数以前各章基本假设总体单元数N是已知的,然是已知的,然后对总体的有关特征如均值、总值、比例等后对总体的有关特征如均值、总值、比例等进行估计。进行估计。n但有些场合,总体单元数是未知的,是要估但有些场合,总体单元数是未知的,是要估计的目标,如:一个池塘中鱼的数量,一片计的目标,如:一个池塘中鱼的数量,一片森林中鸟的数量等。森林中鸟的数量等。n彼得森(彼得森(Peterson,1896)提出捕获再捕)提出捕获再捕获抽样,并将此方法用于野生动物的数量研获抽样,并将此方法用于野生动物的数量研究中。究中。第一节第一节 捕获再捕获抽样
2、捕获再捕获抽样第2页,此课件共46页哦以捕鱼为例说明:以捕鱼为例说明:n假如要估计湖中的鱼的数量假如要估计湖中的鱼的数量N;n从湖中捕获从湖中捕获200条鱼做记号放回湖中,让它们条鱼做记号放回湖中,让它们与湖中未做记号的鱼充分混合。与湖中未做记号的鱼充分混合。n然后从湖中再捕获然后从湖中再捕获100条鱼,假设这次捕获的鱼中条鱼,假设这次捕获的鱼中有有20条是已经做了记号的,若假定鱼的总体没有条是已经做了记号的,若假定鱼的总体没有变化,两次捕鱼都是简单随机抽样,就可以估计湖变化,两次捕鱼都是简单随机抽样,就可以估计湖中的鱼中的鱼20%做了标记,由此可以推断做了标记,由此可以推断N的估计值是的估计
3、值是1000。3第3页,此课件共46页哦这种方法依赖于以下假定:这种方法依赖于以下假定:n(1)总体是封闭的)总体是封闭的两次抽样间没有鱼进入或离开该湖。即对每次抽两次抽样间没有鱼进入或离开该湖。即对每次抽样而言,样而言,N相同。相同。n(2)每个样本都是来自总体的简单随机抽样。即湖中每条鱼都有同)每个样本都是来自总体的简单随机抽样。即湖中每条鱼都有同样机会被捕获。样机会被捕获。n(3)两个样本是独立的。即第一次捕获并放回湖中再次与总体)两个样本是独立的。即第一次捕获并放回湖中再次与总体混合,标记与否和第二次被捕获的概率没有关系。混合,标记与否和第二次被捕获的概率没有关系。n(4)鱼不会丢失其
4、标记,从而有记号的鱼可以被识别。)鱼不会丢失其标记,从而有记号的鱼可以被识别。4第4页,此课件共46页哦5若若 为第二次抽样的样本量,为第二次抽样的样本量,m m为第二次捕获有记号的单元为第二次捕获有记号的单元的数量,有的数量,有则则一、一、直接抽样法直接抽样法先从单元数为先从单元数为N N(未知)的总体中抽取一个随机样本,(未知)的总体中抽取一个随机样本,设样本量为设样本量为 ,把这些单元做上记号,然后放回总体,把这些单元做上记号,然后放回总体,使其与原总体的单元充分混合;这时,做记号的数量占使其与原总体的单元充分混合;这时,做记号的数量占总体数量的比例为总体数量的比例为 ,N,N未知,未知
5、,P P待估计;待估计;再抽取一个样本,观察其中做记号的单元所占的比例,对再抽取一个样本,观察其中做记号的单元所占的比例,对总体的单元数进行估计。总体的单元数进行估计。第5页,此课件共46页哦6可以看成比率估计的特殊形式可以看成比率估计的特殊形式令令1,0,如果第如果第i个做过标记个做过标记如果第如果第i个未做标记个未做标记第6页,此课件共46页哦7由比率估计方差可以得到:由比率估计方差可以得到:有偏有偏当第一次样本量和第二次样本量足够大时,偏差会逐步变小。当第一次样本量和第二次样本量足够大时,偏差会逐步变小。通常对通常对N是略有高估的。是略有高估的。在大样本情况下,估计量在大样本情况下,估计
6、量 近似正态分布,可以给出一定置信近似正态分布,可以给出一定置信度下的置信区间。度下的置信区间。第7页,此课件共46页哦8n前例中,前例中,第8页,此课件共46页哦二、逆抽样法二、逆抽样法n当做记号的单元在总体中的比例很小时,即当做记号的单元在总体中的比例很小时,即 很小,很小,9则在第二次抽样时是一个小比例事件,如果则在第二次抽样时是一个小比例事件,如果 不够大,很可能出现不够大,很可能出现没有记号的单元,即没有记号的单元,即 ,无法对,无法对N进行估计。进行估计。n一种方法:加大第一次抽样的数目;一种方法:加大第一次抽样的数目;n另一种:逆抽样;另一种:逆抽样;n这种方法在第二次抽样时,并
7、不对这种方法在第二次抽样时,并不对 的数量作出规定,而是的数量作出规定,而是一直抽到曾做过记号的单元数达到一直抽到曾做过记号的单元数达到 个为止。个为止。n与直接抽样法不同,此时与直接抽样法不同,此时 是预先规定的,而是预先规定的,而 是一个随机是一个随机变量。变量。第9页,此课件共46页哦n例:欲估计某个森林中啄木鸟的数量。首先随即捕捉了例:欲估计某个森林中啄木鸟的数量。首先随即捕捉了150只啄木鸟,并只啄木鸟,并在鸟的翅膀下染上颜色作为记号,然后予以放飞,适当的一段时间后,在在鸟的翅膀下染上颜色作为记号,然后予以放飞,适当的一段时间后,在第二次捕捉中目标是捕到有记号的啄木鸟第二次捕捉中目标
8、是捕到有记号的啄木鸟35只,结果一共捕捉了只,结果一共捕捉了100只。只。要求估计啄木鸟的数量,并给出估计标准误。要求估计啄木鸟的数量,并给出估计标准误。10第10页,此课件共46页哦n某出版社要调查某一某出版社要调查某一畅销书的盗版数量畅销书的盗版数量,由于正版发行多少册是已,由于正版发行多少册是已知的,相当于已做记号的的知的,相当于已做记号的的 册,然后可以随机的抽取册,然后可以随机的抽取 个购个购买该书的读者,若其中有买该书的读者,若其中有 册正版书,则可以推算出正版书和册正版书,则可以推算出正版书和盗版书的总量,从而算出盗版书的数量。盗版书的总量,从而算出盗版书的数量。n推算总的网站数
9、量推算总的网站数量。在。在CN下注册的网站的数量是已知的,但在下注册的网站的数量是已知的,但在CN外的就无法掌握外的就无法掌握 11n捕获再捕获的抽样方法捕获再捕获的抽样方法 起源于野生动物的估计,可以进一步扩展用于社起源于野生动物的估计,可以进一步扩展用于社会经济的统计。会经济的统计。n广场集会人数的调查广场集会人数的调查。如某报社要报导某次自发性的集会人数,可。如某报社要报导某次自发性的集会人数,可以在广场入口处散发一些小红帽,然后由记者随机抽取一个参与集会以在广场入口处散发一些小红帽,然后由记者随机抽取一个参与集会的样本,该样本中有多少有小红帽,就可以推断出总人数。的样本,该样本中有多少
10、有小红帽,就可以推断出总人数。第11页,此课件共46页哦采用条样(采用条样(Quadrat samples)估计总体密度和数量估计总体密度和数量n直接抽样和逆抽样都是建立在总体单位流动性比较直接抽样和逆抽样都是建立在总体单位流动性比较大的基础上;大的基础上;n对于有些总体的流动性并不是很大,例如松林中发生的松对于有些总体的流动性并不是很大,例如松林中发生的松毛虫灾害,大气中的可吸入颗粒物,就不适宜采用捕捉再毛虫灾害,大气中的可吸入颗粒物,就不适宜采用捕捉再捕捉抽样;捕捉抽样;n通常采用抽取若干样本来估计总体密度,然后根据通常采用抽取若干样本来估计总体密度,然后根据总体的面积或体积来估计总体数量
11、。总体的面积或体积来估计总体数量。12第12页,此课件共46页哦n设一个地区的面积为设一个地区的面积为A,从中随机抽取,从中随机抽取n个样本,这种样本通常称为条个样本,这种样本通常称为条样。若每个条样的面积为样。若每个条样的面积为a,则总体划分为,则总体划分为N个个a,总面积,总面积A=Na。13n这些元素在总体中的密度为这些元素在总体中的密度为第13页,此课件共46页哦n在对密度的估计中,通常假设总体的元素在总体中的分布是随机的,而在对密度的估计中,通常假设总体的元素在总体中的分布是随机的,而不是聚集在一起的,即分布没有一定的规则顺序,因此在条样中不是聚集在一起的,即分布没有一定的规则顺序,
12、因此在条样中 的的分布近似于泊松分布;分布近似于泊松分布;14n先计算样本每个条样中的平均元素数:先计算样本每个条样中的平均元素数:n再估计条样的密度:再估计条样的密度:n总体的元素总量总体的元素总量M的估计值为:的估计值为:n其方差估计为:其方差估计为:第14页,此课件共46页哦n例:在一项耕地的切根虫调查中,抽取的工具是一个例:在一项耕地的切根虫调查中,抽取的工具是一个20cm长和长和20cm宽的一个正方形测框,取宽的一个正方形测框,取10cm的表土来计量切根虫的数量。的表土来计量切根虫的数量。随机取了随机取了10个样框资料,得到每个测框中平均有切根虫个样框资料,得到每个测框中平均有切根虫
13、2条。试估条。试估计在一块计在一块5000平方米的耕地中有多少切根虫,并给出估计标准误。平方米的耕地中有多少切根虫,并给出估计标准误。15解:解:切根虫数切根虫数已知已知该耕地切根虫数估计为该耕地切根虫数估计为25万条,估计标准误为万条,估计标准误为5.59万条。万条。第15页,此课件共46页哦16 第二节第二节 样本轮换样本轮换一、样本轮换的原因一、样本轮换的原因n有些抽样调查是连续性的,需要定期的重复进行;有些抽样调查是连续性的,需要定期的重复进行;n通常逐月、逐季或者每半年一次,都要估计有关指标,通常逐月、逐季或者每半年一次,都要估计有关指标,还要与上月上季或上年同期对比;还要与上月上季
14、或上年同期对比;n为了解决样本老化和更换全部样本单位引起的费用增加以为了解决样本老化和更换全部样本单位引起的费用增加以及前后期比较问题,就要考虑采用样本轮换。及前后期比较问题,就要考虑采用样本轮换。n样本轮换:样本轮换:在抽样调查中,每隔一定时间更换一定比在抽样调查中,每隔一定时间更换一定比例的样本单位,保留其余单位。例的样本单位,保留其余单位。第16页,此课件共46页哦17二、样本轮换的最优比例二、样本轮换的最优比例n假定抽样是放回的简单随机抽样;假定抽样是放回的简单随机抽样;n设在第一个时期的样本量为设在第一个时期的样本量为n,在第二个时期,在第二个时期保留样本的比例为保留样本的比例为p,
15、即保留的样本量为,即保留的样本量为np,同时独立的补充新的样本量同时独立的补充新的样本量nq,p+q=1。第。第二个时期的样本量仍然为二个时期的样本量仍然为n。第17页,此课件共46页哦18n第一个时期与第二个时期相同的第一个时期与第二个时期相同的np个单位在第一个时期个单位在第一个时期的均值的均值n第一个时期的第一个时期的nq个单位在第一个时期的均值个单位在第一个时期的均值nnp个单位在第二个时期的均值个单位在第二个时期的均值nnq个补充单位在第二个时期的均值个补充单位在第二个时期的均值n估计第二个时期的均值,并希望此均值充分利用第一个时期的信息,估计第二个时期的均值,并希望此均值充分利用第
16、一个时期的信息,令令第18页,此课件共46页哦19因为因为要使要使有有可以求得估计量方差可以求得估计量方差第19页,此课件共46页哦20该估计量的方差:该估计量的方差:第20页,此课件共46页哦n如果不利用前期信息,只根据第二期的结果来估计均值,有如果不利用前期信息,只根据第二期的结果来估计均值,有21其方差为其方差为n计算利用前期信息后的设计效应计算利用前期信息后的设计效应见书见书P208:可以得到最优的轮换比:可以得到最优的轮换比:第21页,此课件共46页哦22n三、样本轮换方法(三、样本轮换方法(P209P209)n四、样本轮换应该遵循的原则四、样本轮换应该遵循的原则第22页,此课件共4
17、6页哦23 第三节第三节 敏感性问题的处理敏感性问题的处理n一、敏感性问题一、敏感性问题 所调查的内容涉及个人隐私,受访者不愿或不便于公开的问所调查的内容涉及个人隐私,受访者不愿或不便于公开的问题。题。n如果直接使用对这类问题的答案构成的调查结果来推断总体,如果直接使用对这类问题的答案构成的调查结果来推断总体,显然可靠性值得怀疑。显然可靠性值得怀疑。n一般从两个方面改进:一般从两个方面改进:n改进问卷设计;改进问卷设计;n通过引入专门的抽样技术(随机化模型),消除受访者的防卫心理,通过引入专门的抽样技术(随机化模型),消除受访者的防卫心理,降低受访者因真实回答遭受的隐私受侵害的风险。降低受访者
18、因真实回答遭受的隐私受侵害的风险。第23页,此课件共46页哦n 是指在调查中使用特定的随机化装置,使得被是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。调查者以预定的概率来回答敏感性问题。n 这一技术的宗旨就是最大限度地为被调查这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。者保守秘密,从而取得被调查者的信任。n随机化回答技术随机化回答技术n比如在调查学生考试作弊的问题中,设计外形完全一比如在调查学生考试作弊的问题中,设计外形完全一样的卡片样的卡片k k张,其中张,其中k k1 1张卡片上写上张卡片上写上“你考试是否作过弊你考试是否作过弊?”
19、,n-kn-k1 1张卡片上写上另外的问题。然后放在一盒子张卡片上写上另外的问题。然后放在一盒子里。调查时,由被调查者从盒子里任抽一卡片,根据里。调查时,由被调查者从盒子里任抽一卡片,根据卡片上的问题做出回答,至于卡片上具体是什么问题,卡片上的问题做出回答,至于卡片上具体是什么问题,调查者无权过问。这样就起到了为被调查者保密的作调查者无权过问。这样就起到了为被调查者保密的作用。因而相对于直接问答调查,易于得到被调查者的用。因而相对于直接问答调查,易于得到被调查者的合作。合作。第24页,此课件共46页哦 n沃纳随机化回答模型沃纳随机化回答模型 n西蒙斯模型(西蒙斯模型(Simmons model
20、)随机应答技术的类型随机应答技术的类型第25页,此课件共46页哦二、沃纳随机化回答模型二、沃纳随机化回答模型由美国统计学家沃纳提出,具体的做法是:要调由美国统计学家沃纳提出,具体的做法是:要调查的敏感性问题,列出查的敏感性问题,列出正反正反两个问题。如调查考试作两个问题。如调查考试作弊问题,就作成两种卡片:弊问题,就作成两种卡片:卡片卡片A:我曾在考试中作弊:我曾在考试中作弊 卡片卡片 B:我不曾在考试中作弊:我不曾在考试中作弊 然后由被调查者随机抽取一张来回答然后由被调查者随机抽取一张来回答“是是”或或“否否”,至于卡片上具体是什么问题,调查者无权过问。至于卡片上具体是什么问题,调查者无权过
21、问。因此,调查人员并不知道被调查者在回答那一个问因此,调查人员并不知道被调查者在回答那一个问题,而达到对被调查者个人秘密的保密作用。题,而达到对被调查者个人秘密的保密作用。第26页,此课件共46页哦n 两种卡片的比例是已知的。卡片两种卡片的比例是已知的。卡片A的比例是的比例是P,卡片,卡片B的比例是的比例是1-P。n在大规模调查中,抽中卡片在大规模调查中,抽中卡片A的概率的概率P(A)=P ,抽中卡片抽中卡片B的概的概率率P(B)=1-P n n沃纳随机化回答模型沃纳随机化回答模型n 若若样样本量本量为为n,回答,回答“是是”的人有的人有m个,个,则则n回答回答“是是”的有两种情况:一种抽中了
22、卡片的有两种情况:一种抽中了卡片A,正好是作了弊,另一种正好是作了弊,另一种是抽到了卡片是抽到了卡片B,没有作弊的。,没有作弊的。第27页,此课件共46页哦28受访者受访者卡片卡片A卡片卡片B是是不是不是不是不是是是具有具有A特征特征具有具有B特征特征具有具有A特征特征具有具有B特征特征不管抽到卡片不管抽到卡片A还是还是B,作过弊的概率是相等的,假设为,作过弊的概率是相等的,假设为第28页,此课件共46页哦其方差为:其方差为:无偏估计:无偏估计:第29页,此课件共46页哦n举例:举例:P224.6n解解:第30页,此课件共46页哦仍然存在的两个问题仍然存在的两个问题n1.在模型设计中,受访者需
23、要回答的两个问题仍然都是敏感的;在模型设计中,受访者需要回答的两个问题仍然都是敏感的;n2.要求要求P1/2,而且当,而且当P越接近越接近1/2,估计量方差越大,效率越,估计量方差越大,效率越低。低。n但从消除受访者的顾虑角度看,两种卡片的比例最好是但从消除受访者的顾虑角度看,两种卡片的比例最好是1/2,这样抽中这两类问题的机会是均等的。,这样抽中这两类问题的机会是均等的。n西蒙斯提出一种修改方案:无关问题的随机化回答模型。西蒙斯提出一种修改方案:无关问题的随机化回答模型。n将一张卡片的问题改为与所调查的敏感问完全无关的非敏感问题。将一张卡片的问题改为与所调查的敏感问完全无关的非敏感问题。31
24、第31页,此课件共46页哦三、西蒙斯模型三、西蒙斯模型n 设设提敏感性提敏感性问题问题的卡片的比例是的卡片的比例是P,无关,无关问题问题的卡片的比例是的卡片的比例是1-P。n 对对于敏感性于敏感性问题问题回答回答“是是”的比例的比例为为 ,对对无关无关问题问题回答回答“是是”比比例例为为 。n 若若样样本量本量为为n,回答,回答“是是”的人有的人有m个,个,则则有有第32页,此课件共46页哦33估计量方差估计量方差n例见教材例见教材P217第33页,此课件共46页哦n敏感性问题调查方法的应用敏感性问题调查方法的应用n 某高校在开展关于普及性知识的活动中,要求某高校在开展关于普及性知识的活动中,
25、要求对学校的学生是否有过性行为这一问题进行抽样对学校的学生是否有过性行为这一问题进行抽样调查。调查。n该调查问题具有敏感性,运用通常采取的调查方该调查问题具有敏感性,运用通常采取的调查方式,调查根本无法进行,因此运用了敏感性问题式,调查根本无法进行,因此运用了敏感性问题抽样调查方法;抽样调查方法;n该高校在校生人数为该高校在校生人数为6000人,随机抽取人,随机抽取1500名名学生进行抽样调查,且分别运用了以上的两种方学生进行抽样调查,且分别运用了以上的两种方法,比较统计结果。法,比较统计结果。第34页,此课件共46页哦n 采用随机化的回答技术设计了两种用信封封采用随机化的回答技术设计了两种用
26、信封封装比例一定的问卷;装比例一定的问卷;n一种问题为:一种问题为:“你你有有过性行为吗?过性行为吗?”;另一;另一种问题为:种问题为:“你你没有没有过性行为吗?过性行为吗?”。n在调查时,让同学任意选取一个信封并回答上面在调查时,让同学任意选取一个信封并回答上面的问题,当然调查人员是不知道该同学回答的是哪的问题,当然调查人员是不知道该同学回答的是哪一个问题。一个问题。第一种方法:第一种方法:沃纳随机化回答模型沃纳随机化回答模型n提出两个都具有敏感性相关问题提出两个都具有敏感性相关问题第35页,此课件共46页哦n 这样同学们根据他们的实际情况回答抽到的问题,这样同学们根据他们的实际情况回答抽到
27、的问题,与自己的情况一致的则回答与自己的情况一致的则回答“是是”;否则回答;否则回答“不不是是”。n研究者在设计问卷时,设计第一种问题占研究者在设计问卷时,设计第一种问题占60%,这样两,这样两个问题所占的比例比较接近,有助于让被调查者消除顾虑,个问题所占的比例比较接近,有助于让被调查者消除顾虑,n对收回的问卷进行统计,结果对两种问题回答对收回的问卷进行统计,结果对两种问题回答“是是”的有的有638人,占样本的比例为:人,占样本的比例为:m/n=638/1500=0.4253第36页,此课件共46页哦已知已知 m/n=638/1500=0.4253,P=60%n将它代入将它代入n其方差为:其方
28、差为:n得到回答第一种问题为得到回答第一种问题为“是是”的人数估计比例:的人数估计比例:n估计标准误为:估计标准误为:第37页,此课件共46页哦n 同同样样采用随机化的回答技采用随机化的回答技术设计术设计了两种用信封封装比例一定的了两种用信封封装比例一定的问问卷,然而一种卷,然而一种问题为问题为:“你有你有过过作弊行作弊行为吗为吗?”;为为了了统计统计的方的方便,便,另一种问题设另一种问题设计为:计为:“你是四月份出生的吗?你是四月份出生的吗?”。n 显显然,第二个然,第二个问题问题与所要与所要调查调查的的问题问题无关,而且被无关,而且被调查调查同学当同学当中是四月份出生的比例可以很容易从学校
29、教中是四月份出生的比例可以很容易从学校教务处务处学生信息中心收学生信息中心收集到。集到。n经统计该经统计该校学生中四月份出生者所占的比例校学生中四月份出生者所占的比例为为15.38%。其中。其中设计设计的的问问卷中第一种卷中第一种问题问题同同样样占占60%,统计结统计结果果为对为对两种两种问题问题回答回答“是是”的有的有206人,占人,占样样本的比例本的比例为为:m/n=206/1500n第二种方法:第二种方法:提出的两个问题,一个为敏感性问题,提出的两个问题,一个为敏感性问题,另一个为与调查内容无关的非敏感性问题。另一个为与调查内容无关的非敏感性问题。第38页,此课件共46页哦n得到回答第一
30、种问题为得到回答第一种问题为“是是”的人数估计比例:的人数估计比例:其方差为:其方差为:n可以看出采用两种调查技术,最终得出的结果是接近的可以看出采用两种调查技术,最终得出的结果是接近的 估计标准误为:估计标准误为:第39页,此课件共46页哦第四节第四节 交叉子样本交叉子样本n交叉子样本方法,又称为随机组方法,是将抽出的样本分交叉子样本方法,又称为随机组方法,是将抽出的样本分成若干组,每个组形成一个子样本,再利用每个子样本之成若干组,每个组形成一个子样本,再利用每个子样本之间的离散程度构造方差估计量。间的离散程度构造方差估计量。n对于复杂抽样便于计算估计量方差和估计标准误;对于复杂抽样便于计算
31、估计量方差和估计标准误;n还可以用于发现偏差,核对调查员的调查质量。还可以用于发现偏差,核对调查员的调查质量。40第40页,此课件共46页哦一、独立的交叉子样本一、独立的交叉子样本n设总体为设总体为N,从中抽取容量为,从中抽取容量为n的样本。并不直接抽取,而是的样本。并不直接抽取,而是抽取抽取k个子样本,每个子样本的容量为个子样本,每个子样本的容量为m,n=km,每个子样,每个子样本都可以得到总体指标本都可以得到总体指标 的无偏估计量的无偏估计量 ,那么总体指标,那么总体指标的估计量及其方差为:的估计量及其方差为:41第41页,此课件共46页哦4212345678910111213141516
32、171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412537637737837938038138238338438538638738838939039139239339
33、4395396397398399400n例:教材例:教材P220195192190188185每个子样本房屋数合计每个子样本房屋数合计估计量方差估计为估计量方差估计为第42页,此课件共46页哦43估计量方差估计为估计量方差估计为第43页,此课件共46页哦44n交叉子样本方法也适用于复杂的估计量,比如,比率估计量。交叉子样本方法也适用于复杂的估计量,比如,比率估计量。如果每个子样本的估计量为如果每个子样本的估计量为 ,则总体的比率估计量为:,则总体的比率估计量为:估计量方差的样本估计为:估计量方差的样本估计为:第44页,此课件共46页哦例例.为研究被调查者拒答情况,实施一项调查。抽样方式为两阶段
34、抽样,为研究被调查者拒答情况,实施一项调查。抽样方式为两阶段抽样,第一阶段采用分层随机抽样从各城区中随机抽取居委会,假设各层层第一阶段采用分层随机抽样从各城区中随机抽取居委会,假设各层层权相同。第二阶段从抽中的居委会随机抽取住户。抽出样本权相同。第二阶段从抽中的居委会随机抽取住户。抽出样本 一后将其一后将其放回总体,再按相同的抽样方式抽取样本二,两样本的拒答统计结果放回总体,再按相同的抽样方式抽取样本二,两样本的拒答统计结果见下表。利用随机组方法估计拒答率见下表。利用随机组方法估计拒答率 及其方差。及其方差。45城 区样本 一样本二拒答户数 合格调查户数 拒答户数 合格调查户数 123414038150149145373038149148150总计119444105447第45页,此课件共46页哦46城 区样本一 样本 拒答户数 合格调查户数 拒答户数 合格调查户数 123414038150149145373038149148150总计119444105447估计量方差估计为估计量方差估计为根据样本一,估计拒答率根据样本一,估计拒答率根据样本二,估计拒答率根据样本二,估计拒答率拒答率估计为拒答率估计为第46页,此课件共46页哦