抽样调查作业集合.doc

上传人:豆**** 文档编号:17603865 上传时间:2022-05-25 格式:DOC 页数:10 大小:478KB
返回 下载 相关 举报
抽样调查作业集合.doc_第1页
第1页 / 共10页
抽样调查作业集合.doc_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《抽样调查作业集合.doc》由会员分享,可在线阅读,更多相关《抽样调查作业集合.doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流抽样调查作业集合.精品文档.填空题:1.若样本统计量w的期望和方差分别为E(w)和var(w),那么以样本统计量w 估计总体的数字特征W,有偏量B(w)=E(w)-W;均方偏差MSE(w)=E(w-W)2;且偏量、统计量w的方差与均方偏差三者之间的关系为:MSE(w)= var(w)+B(w)2.2.在概率抽样调查中,有简单随机抽样、不等概抽样、分层抽样、多阶抽样、系统抽样、多相抽样等基本的抽样方法。3.抽样框:又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便

2、可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框除包含有抽样单位的编号及抽样单位与总体、个体单位的联系外,还应包含一些有用的辅助信息。这些辅助吸血可用于抽样方案的设计和数据处理,有益于提高调查的质量。4.抽样方案的设计要求:利用抽样框的辅助信息,综合各种基本的概率抽样方法来制定一个可行的、精度满足要求而且费用最省的抽样方法。5.一个完整的抽样策略由抽样方法应配合有一个相适应的估计结合在一起组成。6. 总体采用简单随机抽样时,对总体目标量的均值或总数,可以有多种估计方法。在没有辅助信息是,可以采用简单估值法,以样本的均值估

3、计总体的均值;当有适宜的辅助信息利用时,可以采用比估计和回归估计。7.二相抽样是对总体进行一次以上的抽样。第一次抽样的样本单元并不是调查所需的目标量,而是调查一些可通过较小的工作量快速获得辅助信息;第二次抽样则是在获得辅助信息的基础上,再作一个样本量较小的调查,调查所需的目标量。8. 分层随机抽样适用于总体单位数量较多、内部差异较大的调查对象。在分层时,要使层内的个体单元有较好的同一性,层间的差异较大。9.多阶段抽样与整群抽样都是将总体分成若干小的群体,这些小的群体为第一性抽样单元。再对抽中的第一性抽样单元抽样,其中的个体为第二性抽样单元。10.有放回不等概抽样是每个单元入样概率正比于规模测度

4、的抽样方法;实施无放回不等概抽样的方法主要有:布鲁尔法和德宾法。定义:即抽取概率。计算题:1.假设总体容量为N=6,其标志值分别为1,2,3,5,6,7.若分为两个群(1,2,3)和(5,6,7),计算群内相关系数。它能说明什么问题。又若分为(1,5,7)和(2,3,6), 计算群内相关系数。它又能说明什么问题。2.给定一个包含25个单元的目标为总体,先排成5行5列的形式,每行每列均包含5个单元,单元排列先按列排列,考虑n=k=5的系统抽样,以行为群组成系统样本,而以列为层。若按从小到大的顺序排列,比较该系统抽样,简单抽样,及分层抽样的效率。12345112262936442182829364

5、6319283039484242833395052529344052解: 依题意可知:分为以下两种情况讨论。i)以行为群,组成系统抽样。此时,。根据公式: , 有:表c123451122629364429.40142.82182829364631.40107.83192830394832.80122.74242833395034.80103.75252934405236.00111.5所以:由上述可知:3.某县农村共有14个乡509个村,在实现小康的过程中欲计算该县农村的恩格尔系数(居民的食品支出占总指出的比例)。首先要调查全县的食品总支出,现采用了二阶段抽样,第一阶段先在14个乡中,按村的的

6、数目多少进行了PPS抽样,共抽取5个乡,第二阶段在抽取的乡中随机地抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:样本乡序号k村数样本村数样本村平均食品支出(万元)119648241617537261084546905366100要估计全县的食品支出总金额及估计的标准差。问题分析:此题为第一阶段是以14个乡中所含村的个数为规模测度的PPS抽样,第二阶段是取等额的简单随机抽样的二阶抽样。故(*)由题意可知:总村数N=509,样本乡数k=5,第i个样本乡的入样概率,抽取的样本总村数n=30,第二阶段为取等额的简单随机抽样故其中表示第i个样本乡中第j个样本村的食品支出总额。解: 将代入后得

7、代入数据可得估计值为:(万元) 均方偏差的无偏估计量: 将【】式与代入左式得 【】 其中 再代入数据 =1088776199.4(万元)故标准差为:=10434(万元)注意:其中公式【】与公式【】的运用是在第一阶段是正比于子总体规模的PPS抽样,第二阶段是取等额的简单随机抽样的二阶抽样的前提条件下才能进行的。4.若假设已知该县有380千人,并有各个乡的人口资料,则第一阶段按与乡的人口多少成比例地抽样,也抽取5个乡。第二阶段用简单随机抽样抽取6个村得数据如下表,再估计全县的食品支出总金及估计的标准差。样本乡序号k人口数村数样本村平均食品支出(万元)124309625041175338351674

8、604818853039130问题分析:此题与前一题的差别不大,抽样方法都是第一阶段是PPS抽样,第二阶段是取等额的简单随机抽样的二阶抽样。唯一不同的是两者的规模测度不同,此题是按与乡的人口数为规模测度的PPS抽样。故此题中,其中为该县的总人数,为抽中样本乡的总人数。没有与子总体的成正比,不能用直接公式【】与公式【】解:(万元)(万元)标准差为: =3043(万元)注意:两题抽样方法的选择虽然相同,但PPS抽样中的规模测度选择不同导致估计的效率不同,从而影响到估计的准确度。1 (城镇)235600.1371518039723002(农村)1482400.86398562546250合计1719

9、805.某市进行家庭收入调查,分城镇居民与农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇平均年收入标准差为3000元,农村年平均户收入标准差为2000元. 且对城镇居民与农村居民抽样平均每户费用比为1:2. 给出城镇与农村两层比列分配与最优分配的样本量的分配。解:已知总体总量 , 城镇居民总量, 农村居 民总量,, 总样本容量 n=550, 城镇占总体比例, 农村占总体比例, 费用比。 1. 按比例分配:城镇样本量: 农村样本量:2. 考虑费用前提下的最优分配由定理4.3.2知 k为待求得比例系数又因为:

10、 则 (若不考虑费用)(奈曼最优分配):由定理4.3.1知 固定 有考虑本题有6. 三种样本量估算的比较条件n值(样本量)简化公式按绝对精度d按相对精度h.考虑费用注:是N(0,1)分布的分位数,是总体方差,d是绝对精度, N:总体种抽样单位的数额,为变异系数,是调查的基本费用,是每调查一个样本单元所需费用,是常数。某大城市进行计算机普及率的调查,若从全市数百万户家庭中,简单随机地抽取n户进行调查,为了使普及率的绝对误差不超过2%,样本量n应取多大? 解:此问题待估量是总体普及率P , 若P=, 则按( 2.3.4) 式的设定, 易算出总体方差并易发现当P 从0上升到0.5 时,P(1-P)是

11、随着递增的,当P从0.5再增加到1 时,P(1-P)是递降的.在P=0.5时达到最大值= P(1-P) =0.25.按最保险的情况估算样本量, 则可取如果我们在计算机普及率有一个很粗糙的估计, 估计该普及率应在10% 至20% 之间, 那么我们只要对P 在此区间来粗略估算相应的.在此区间时P取20% 有最大的值0.20.8= 0.16. 故样本量n 取下述值就够了: 当对精度的要求不是绝对精度,而是相对精度时,样本量应用(2.4.5)或(2.4.6) 式估算.对普及率P,变异系数C=.当P从0变到1时,它是递降的.因而P值越小变异系数越大.于是若普及率P 在10%至20%之间,则按在P =10

12、% 所相应的可能的最大变异系数值C=0.9/0.1=3,估算样本量n.当相对误差h 取为20%时, 由(2.4.6)式7. 从某地区15786位老人中,抽出一个含有525位老人的简单随机样本,调查每位老人的性别及生活是否能够自理,结果如下:性别生活能否自理男 女能不能211 263 31 20估计该地区生活不能自理的老人的人数,并估计标准差,并以95%的置信度对其作区间估计。解:该地区生活不能自理的老人的比例该地区生活不能自理的老人的人数人标准差的估计值为95%的置信度区间估计为证明题1.设 E1,V1是对第一步抽样求均值和方差,E2,V2为给定第一步抽样结果的条件下对第二步抽样求均值及方差,

13、求证:按两步抽样获得的估计量方差有:V()=V1E2()+E1V2()2若样本统计量w的期望和方差分别为E(w)和var(w),那么以样本统计量w 估计总体的数字特征W,有偏量B(w)=E(w)-W;均方偏差MSE(w)=E(w-W)2;求证:统计量w的偏量、方差与均方偏差三者之间的关系为:MSE(w)= var(w)+B(w)2例子:用最大规模法对下例进行不等概抽样。一村庄有8个果园,分别有果树50,30,65,80,140,44,20,100棵,要调查该村庄水果总产量,以正比于果树棵数的概率取1个果园作样本。设从1,2,8中抽取随机数为5;从1,2,140中抽取随机数为87。果园序列12345678规模测度503065801404420100

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁