《抽样调查 不等概抽样.pptx》由会员分享,可在线阅读,更多相关《抽样调查 不等概抽样.pptx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、PPS抽样的概念PPS抽样的实现方法PPS抽样的估值法最优规模测度第1页/共29页PPS抽样的概念uPPS抽样的使用背景l调查一城市企业的产值,各企业单位是抽样单元,企业规模差异很大,有不同的资产.l调查某一地区小麦产量,以村为抽样单元,但各村 拥有的麦地面积不一样.l调查某商贸集团的销售额,以其下辖各超市为抽样 单元,各超市的销售人员数量不等。第2页/共29页PPS抽样的概念uPPS抽样的概念lProbability proportion to size.l各单元被抽取的概率正比于规模测度l每次抽取后放回抽中的单元再作下次抽取.第3页/共29页PPS抽样的实现方法u累积和法1、求规模测度的累
2、积和2、对自然数集合 1,2,X 作有放回简单随机抽样,根据抽得随机数a决定入样单元.若则第一个单元入样则第i个单元入样,i=2,3,N3、重复2,直至抽得n个单元.第4页/共29页PPS抽样的实现方法u累积和法的另一种形式从0,1中取均匀分布随机数r,重复以上步骤,直至抽得n个单元.第5页/共29页PPS抽样的实现方法u最大规模法1、求规模测度的最大值2、从 1,2,N 抽取随机数a,同时独立地从1,2,M中抽取随机数b,若则第a个单元入样,否则此次抽取无单元入样.3、重复2,直至抽得n个单元.(由统计学家Lahiri最先提出)第6页/共29页PPS抽样的实现方法u目录抽样1、计算抽样间隔2
3、、从 1,2,K 抽取随机数R1,由K确定R2=R1+K,R3=R1+2K,Rn=R1+(n-1)K;3、根据Ri所在位置确定入样单元:(假定K为整数);第7页/共29页例题与练习例1 某县有32个乡,每个乡参加分配人口数如表,要调查人均收入,用累积和法抽取8个乡作为样本.例2 以下列概率从总体1,2,3,4,5中抽取容量为2的样本.例3 一村庄有8个果园,分别有果树50,30,65,80,140,44,20,100棵,要调查该村庄水果总产量,以正比于果树棵数的概率取3个果园作样本.第8页/共29页例题与练习练习1 设某个总体有N=10个样本,相应的单元大小Mi及其代码数如表所示,用PPS法抽
4、取一个n=3的样本。第9页/共29页PPS抽样的估值法第10页/共29页PPS抽样的估值法一般无放回不等概抽样比有放回效率高,但理论方法麻烦复杂.实践中,N较大,f 不太大时,均利用上述定理进行估值和误差计算.无放回PPS抽样的实现:在前面方法中去掉重复单元即可.第11页/共29页例题与练习例3 一村庄有8个果园,分别有果树50,30,65,80,140,44,20,100棵,要调查该村庄水果总产量.如果实地调查得第5,第8、第3号三个果园的产量(单位:10 千克)分别为15,12,7,计算该村八个果园的总产量的估计量和估计量的均方偏差。再用简单估值法进行估计,并比较两个结果的优劣。第12页/
5、共29页例题与练习练习1 某部门要了解所属8500家生产企业当月完成的利润,该部门手头已有一份去年各企业完成产量的报告,将其汇总得到所属企业去年完成的产量为3676万吨。考虑时间因素,准备采用抽样调查来推算当月完成的利润。根据经验,企业的产量和利润相关性较强,且企业的特点是规模和管理水平差异比较大,通常大企业的管理水平较高,因此采用与去年产量成比例的pps抽样,从所属企业中抽出一个样本量为30的样本。估计当月的利润及其标准差。练习2 某企业欲估计上季度每位职工的平均病假天数。该企业共有8个分厂,现用pps抽样抽取三个分厂为样本,并以95%的置信度计算其置信区间。第13页/共29页最优规模测度一
6、般,选择合适的规模测度可提高估计精度.第14页/共29页不等概PS抽样的概念估值法不等概PS抽样的实现第15页/共29页不等概PS抽样的概念l proportion to size.l每次抽取后抽中的单元不放回,要求各单元的入样概率正比于规模测度u PS抽样的概念u修正概率修正概率抽样次数较多时,确定修正概率很麻烦,通常将总体分成许多层,在每层使用样本量为2的PS抽样第16页/共29页不等概PS抽样的实现uBrewerBrewer抽样方法抽样方法(1963年由Brewer提出)l大体思路 设计好第一次抽取概率,令第二次抽取概率正比于pi,使总的入样概率正比于Xil实现步骤第17页/共29页不等
7、概PS抽样的实现l实现步骤第18页/共29页不等概PS抽样的实现uDurbinDurbin抽样方法抽样方法l大体思路 第一次抽取概率正比于pi,调整第二次的抽取概率,使总的入样概率正比于Xil实现步骤第19页/共29页不等概PS抽样的实现第20页/共29页不等概PS抽样的实现uSen-MidzunoSen-Midzuno抽样方法抽样方法l大体思路 解决样本量超过2的麻烦,使 i i近似地正比于近似地正比于X Xi il实现步骤2、从剩下的N-1个单元中,抽取容量为n-1的简单随机样本(不放回)第21页/共29页估 值 法uHorvitz-ThompsonHorvitz-Thompson估计估计
8、(HTHT估计估计)总体总数总体总数Y Y的估计值为的估计值为第22页/共29页估 值 法第23页/共29页例题与习题例:假设有5个居委会,每个居委会的住户数X已知,但常住居民人数Y未知,从这5个居委会抽出2个来估计常住居民的总人数。第24页/共29页实现方法估值法第25页/共29页实 现 方 法u大体思路 将总体随机分成n个群,从每个群中以正比于规模测度的概率抽取一个单元,组成容量为n的样本u实现步骤2、在每一群中,以正比于规模测度的概率抽取一个单元,每群一个单元组成样本量为n的样本第26页/共29页估 值 法为总体总数Y的无偏估计.该估计的均方偏差为第27页/共29页估 值 法有放回抽样的效率比无放回低但分析计算较简单抽样比f很小时,无放回与有放回相比,提高的效率有限,因而现实中多用PPS抽样;仅当f很大时,才使用PS抽样或随机分群抽样.第28页/共29页谢谢您的观看!第29页/共29页